본문 바로가기
배움: MBA, English, 운동

OpenAI o1 - preview 소개

by Heedong-Kim 2024. 9. 13.

OpenAI o1-preview 소개

어려운 문제 해결을 위한 새로운 추론 모델 시리즈가 출시됩니다. 9월 12일부터 이용 가능합니다.

우리는 과거 모델들보다 더 오랜 시간을 들여 생각하는 새로운 AI 모델 시리즈를 개발했습니다. 이 모델들은 과학, 코딩, 수학과 같은 복잡한 작업을 해결할 수 있도록 설계되었습니다.


오늘부터 이 시리즈의 첫 번째 모델을 ChatGPT와 API에서 사용할 수 있습니다. 이는 프리뷰 버전이며, 정기적으로 업데이트 및 개선될 예정입니다. 이와 함께 개발 중인 다음 업데이트에 대한 평가도 포함됩니다.

 


작동 방식 (How it works) 


이 모델들은 사람처럼 문제를 해결하기 전에 더 많은 시간을 들여 생각하도록 훈련되었습니다. 훈련을 통해 사고 과정을 정교하게 다듬고, 다양한 전략을 시도하며, 실수를 인식하는 법을 배웠습니다.

테스트 결과, 다음 모델 업데이트는 물리학, 화학, 생물학의 어려운 벤치마크 과제에서 박사 과정 학생들과 비슷한 성과를 보였습니다. 또한, 수학 및 코딩 분야에서도 뛰어난 성과를 보였습니다. 국제 수학 올림피아드(IMO) 예선 시험에서 GPT-4o는 문제의 13%만을 해결했지만, 새로운 추론 모델은 83%를 해결했습니다. 코딩 능력은 Codeforces 대회에서 상위 89%에 달했습니다. 자세한 내용은 기술 연구 게시글에서 확인할 수 있습니다.

이 초기 모델은 웹 브라우징이나 파일, 이미지 업로드와 같은 기능이 없지만, 복잡한 추론 작업에 있어서는 중요한 발전을 이루었습니다. 이에 따라 이번 시리즈를 OpenAI o1이라고 명명하고 다시 카운트를 1로 설정했습니다.

 


안전성 (Safety) 


이 새로운 모델을 개발하는 과정에서, 우리는 모델이 안전성 및 정렬 가이드라인을 더 효과적으로 따를 수 있도록 하는 새로운 안전 훈련 방식을 도입했습니다. 모델이 문맥에서 안전 규칙을 추론할 수 있기 때문에 이를 더 잘 적용할 수 있습니다.

모델의 안전성을 측정하는 한 가지 방법은 사용자가 규칙을 우회하려 할 때도 얼마나 잘 규칙을 따르는지 테스트하는 것입니다. 가장 어려운 테스트 중 하나에서 GPT-4o는 0에서 100까지의 점수 중 22점을 받았으나, o1-preview 모델은 84점을 기록했습니다. 자세한 내용은 시스템 카드 및 연구 게시글에서 확인할 수 있습니다.

새로운 모델의 성능에 맞추어 안전성 작업, 내부 관리, 연방 정부와의 협력도 강화했습니다. 여기에는 최첨단 레드팀 테스트 및 최고 수준의 준비 프레임워크를 통한 엄격한 테스트와 평가가 포함되며, 안전 및 보안 위원회의 이사회 검토 절차를 거칩니다.

AI 안전성에 대한 우리의 약속을 강화하기 위해, 우리는 최근 미국 및 영국 AI 안전 연구소와 공식 협약을 체결했습니다. 연구소에 모델의 연구 버전의 조기 접근 권한을 부여하였으며, 이를 통해 향후 모델의 연구, 평가, 테스트를 위한 프로세스를 구축하기 위한 첫 단계를 마련했습니다.

 

 

대상 (Whom it's for) 

 

이 향상된 추론 능력은 과학, 코딩, 수학 등 복잡한 문제를 해결하는 데 특히 유용할 수 있습니다. 예를 들어, o1은 의료 연구자들이 세포 시퀀싱 데이터를 주석 처리하는 데 사용될 수 있고, 물리학자들이 양자 광학에 필요한 복잡한 수학 공식을 생성하는 데 사용할 수 있으며, 모든 분야의 개발자들이 다단계 워크플로를 구축하고 실행하는 데 활용할 수 있습니다.

 

OpenAI o1-mini

 

o1 시리즈는 복잡한 코드를 정확하게 생성하고 디버깅하는 데 뛰어납니다. 개발자를 위한 보다 효율적인 솔루션을 제공하기 위해, OpenAI o1-mini도 출시했습니다. 이 모델은 코딩에 특히 효과적인 빠르고 저렴한 추론 모델입니다. o1-mini는 o1-preview보다 80% 저렴하며, 추론이 필요하지만 광범위한 세계 지식이 필요하지 않은 애플리케이션에 강력하고 비용 효율적인 모델입니다.

 

OpenAI o1 사용 방법

 

오늘부터 ChatGPT Plus 및 Team 사용자들은 ChatGPT에서 o1 모델을 사용할 수 있습니다. o1-preview와 o1-mini는 모델 선택기에서 수동으로 선택할 수 있으며, 초기에는 주간 제한이 각각 30 메시지(o1-preview)와 50 메시지(o1-mini)로 설정됩니다. 우리는 이러한 제한을 늘리고, ChatGPT가 주어진 프롬프트에 맞는 모델을 자동으로 선택할 수 있도록 작업 중입니다.

 

 

ChatGPT Enterprise 및 Edu 사용자들은 다음 주부터 두 모델 모두에 접근할 수 있습니다.

 

API 사용 티어 5에 해당하는 개발자는 오늘부터 두 모델을 API에서 프로토타이핑할 수 있으며, 초당 20개의 요청(RPM) 제한이 적용됩니다. 추가 테스트 후에 이러한 제한을 늘릴 계획입니다. 현재 이 모델의 API는 함수 호출, 스트리밍, 시스템 메시지 지원 및 기타 기능을 포함하지 않습니다. 시작하려면 API 문서를 확인하세요.

http://platform.openai.com/docs/guides/reasoning

 

 

우리는 또한 모든 ChatGPT 무료 사용자에게 o1-mini 액세스를 제공할 계획입니다.