본문 바로가기
배움: MBA, English, 운동

OpenAi - Canvas 소개

by Heedong-Kim 2024. 10. 4.

2024년 10월 3일

Canvas 소개

 

ChatGPT와 함께 글쓰기 및 코딩 작업을 새롭게 할 수 있는 방식

 

우리는 Canvas라는 새로운 인터페이스를 도입했습니다. 이 인터페이스는 단순한 채팅을 넘어서 글쓰기와 코딩 프로젝트를 진행하는 방식에 변화를 줍니다. Canvas는 별도의 창으로 열리며, ChatGPT와 함께 프로젝트를 협력적으로 진행할 수 있도록 합니다. 이 초기 베타 버전은 대화 외에도 아이디어를 함께 생성하고 다듬는 새로운 작업 방식을 제공합니다.

 

Canvas는 GPT-4o를 기반으로 하며, 베타 기간 동안 모델 선택기에서 수동으로 선택할 수 있습니다. 오늘부터 ChatGPT Plus 및 팀 사용자들에게 전 세계적으로 Canvas가 출시되며, 엔터프라이즈 및 교육 사용자는 다음 주에 액세스할 수 있습니다. 또한, 베타가 종료된 후에는 모든 ChatGPT 무료 사용자들에게도 Canvas가 제공될 예정입니다.

ChatGPT와의 더 나은 협업

사람들은 ChatGPT를 매일 글쓰기와 코딩에 도움을 받기 위해 사용합니다. 채팅 인터페이스는 간단하고 많은 작업에 적합하지만, 수정과 반복이 필요한 프로젝트 작업에서는 한계가 있었습니다. Canvas는 이러한 작업을 위한 새로운 인터페이스를 제공합니다.

 

Canvas에서는 ChatGPT가 사용자가 달성하려는 목표의 맥락을 더 잘 이해할 수 있습니다. 특정 섹션을 강조 표시하여 ChatGPT가 집중해야 할 부분을 정확히 지시할 수 있습니다. 마치 카피 에디터나 코드 리뷰어처럼, 전체 프로젝트를 염두에 두고 인라인 피드백과 제안을 제공합니다.

 

Canvas에서 프로젝트를 제어할 수 있습니다. 텍스트나 코드를 직접 편집할 수 있으며, 글 길이 조정, 코드 디버깅 등 다양한 유용한 작업을 빠르게 수행할 수 있는 바로 가기 메뉴도 있습니다. 이전 버전의 작업을 복구할 수 있는 백 버튼도 제공됩니다.

 

ChatGPT가 유용할 수 있는 시나리오를 감지하면 Canvas가 자동으로 열리며, “Canvas 사용”이라는 명령어를 포함하면 기존 프로젝트에서 Canvas를 열 수 있습니다.

글쓰기 바로 가기 메뉴:

  • 수정 제안: ChatGPT가 인라인 제안 및 피드백을 제공합니다.
  • 길이 조정: 문서 길이를 짧게 또는 길게 조정합니다.
  • 읽기 수준 조정: 유치원 수준부터 대학원 수준까지 읽기 수준을 조정합니다.
  • 마지막 다듬기: 문법, 명확성 및 일관성을 확인합니다.
  • 이모지 추가: 강조와 색상을 위해 관련 이모지를 추가합니다.

 

Canvas에서의 코딩

코딩은 반복적인 과정이며, 채팅에서 코드를 수정하는 모든 과정을 추적하는 것이 어려울 수 있습니다. Canvas는 이러한 수정 과정을 더 쉽게 따라가고 이해할 수 있도록 도와줍니다. 우리는 앞으로도 이러한 수정 투명성을 지속적으로 개선할 계획입니다.

코딩 바로 가기 메뉴:

  • 코드 검토: ChatGPT가 코드 개선을 위한 인라인 제안을 제공합니다.
  • 로그 추가: 디버깅과 코드 이해를 돕기 위해 print 문을 추가합니다.
  • 주석 추가: 코드를 이해하기 쉽게 주석을 추가합니다.
  • 버그 수정: 문제 있는 코드를 감지하고 오류를 해결하도록 다시 작성합니다.
  • 언어로 포팅: JavaScript, TypeScript, Python, Java, C++, PHP 등의 언어로 코드를 변환합니다.

 

협업자로서의 모델 훈련

우리는 GPT-4o를 창의적인 파트너로서 협업할 수 있도록 훈련했습니다. 이 모델은 언제 Canvas를 열고, 특정 수정 작업을 수행하며, 전체적으로 다시 작성해야 하는지 인식할 수 있습니다. 또한 더 넓은 맥락을 이해하고, 정확한 피드백과 제안을 제공할 수 있습니다.

 

이를 위해 우리의 연구 팀은 다음과 같은 핵심 행동을 개발했습니다:

  • 글쓰기 및 코딩 시 Canvas 트리거링
  • 다양한 콘텐츠 유형 생성
  • 목표 수정 작업 수행
  • 문서 다시 작성
  • 인라인 비평 제공

우리는 20개 이상의 자동화된 내부 평가를 통해 성과를 측정했습니다. OpenAI o1-preview의 출력을 증류하는 새로운 합성 데이터 생성 기법을 사용하여 모델의 핵심 행동을 포스트 트레이닝하였습니다. 이 접근 방식 덕분에 인간이 생성한 데이터에 의존하지 않고도 글쓰기 품질과 새로운 사용자 상호작용 문제를 신속하게 해결할 수 있었습니다.

 

주요 과제 중 하나는 Canvas를 언제 트리거할지 정의하는 것이었습니다. 우리는 "커피 원두의 역사에 관한 블로그 게시물을 작성하세요"와 같은 명령에는 Canvas를 열도록 훈련시킨 반면, "저녁 요리법을 도와주세요"와 같은 일반적인 Q&A 작업에는 과도하게 트리거되지 않도록 했습니다. 글쓰기 작업의 경우 "올바른 트리거"를 개선하는 데 중점을 두었으며, "올바르지 않은 트리거"를 희생하더라도 83%의 정확도에 도달했습니다. 이는 기본 제로샷 GPT-4o가 제공하는 지시문과 비교한 결과입니다.

 

이러한 기준선의 품질은 사용된 특정 프롬프트에 매우 민감하다는 점에 주목할 가치가 있습니다. 다른 프롬프트를 사용하면 기준선의 성능이 여전히 저조할 수 있지만, 그 오류 분포는 코딩 및 글쓰기 작업에 걸쳐 균등하게 부정확하게 나타날 수 있습니다. 이는 다양한 오류 분포와 다른 형태의 최적화되지 않은 성능을 초래합니다. 코딩의 경우, 우리는 파워 유저들을 방해하지 않기 위해 의도적으로 모델의 트리거 빈도를 낮추도록 편향시켰습니다. 우리는 계속해서 사용자 피드백을 바탕으로 이를 개선할 계획입니다.

 

 

두 번째 과제는 Canvas가 트리거된 후 모델의 편집 동작을 조정하는 것이었습니다. 특히, 특정 부분을 수정할지 아니면 전체 내용을 다시 작성할지를 결정하는 부분에서 어려움이 있었습니다. 사용자가 인터페이스를 통해 텍스트를 명시적으로 선택할 경우 모델이 목표 편집을 수행하도록 훈련하였으며, 그 외의 경우에는 전체 다시 작성을 선호하도록 하였습니다. 이 행동은 모델을 계속해서 개선함에 따라 진화하고 있습니다.

 

 

마지막으로, 고품질의 주석을 생성하도록 모델을 훈련하는 데는 신중한 반복 작업이 필요했습니다. 첫 번째와 두 번째 사례는 철저한 수동 검토를 통해 자동 평가에 쉽게 적응할 수 있었지만, 주석 품질을 자동으로 측정하는 것은 특히 까다로웠습니다. 따라서 우리는 주석의 품질과 정확성을 평가하기 위해 인간 평가를 사용했습니다. 통합된 Canvas 모델은 제로샷 GPT-4o 지시문과 비교하여 정확성에서 30%, 품질에서 16% 향상된 성과를 보여주었으며, 이는 합성 훈련이 지시문만 사용한 제로샷 프롬프트보다 반응 품질과 행동을 크게 향상시킨다는 것을 입증합니다.

 

 

향후 계획

AI를 더 유용하고 접근 가능하게 만드는 것은 우리가 상호작용하는 방식을 재고해야 한다는 것을 의미합니다. Canvas는 새로운 접근 방식이며, ChatGPT의 시각적 인터페이스에서 우리가 두 해 전에 출시한 이후로 가장 큰 업데이트입니다.

Canvas는 아직 초기 베타 상태이며, 우리는 이 기능의 역량을 빠르게 개선할 계획입니다.