오늘 ChatGPT와 API를 통해 OpenAI 추론 시리즈 중 가장 최신이자 비용 효율성이 뛰어난 모델인 OpenAI o3-mini를 출시합니다.
2024년 12월에 미리 공개된 이 강력하고 빠른 모델은 소형 모델이 달성할 수 있는 한계를 확장하며, 과학, 수학, 코딩 분야에서 특히 뛰어난 STEM 역량을 제공하는 동시에 OpenAI o1-mini의 낮은 비용과 짧은 지연시간을 유지합니다.
OpenAI o3-mini는 함수 호출, 구조화된 출력, 개발자 메시지 등 개발자들이 강력하게 요청한 기능들을 지원하는 최초의 소형 추론 모델로, 출시와 동시에 생산 환경에 바로 적용할 수 있습니다. OpenAI o1-mini와 OpenAI o1-preview처럼 o3-mini도 스트리밍을 지원하며, 개발자들은 낮음, 중간, 높음의 세 가지 추론 노력 옵션 중에서 선택하여 특정 사용 사례에 최적화할 수 있습니다. 이 유연성 덕분에 o3-mini는 복잡한 문제를 다룰 때 “더 열심히 생각”하거나, 지연 시간이 중요한 경우 속도를 우선시할 수 있습니다. 단, o3-mini는 시각 기능을 지원하지 않으므로 시각적 추론 작업은 계속해서 OpenAI o1을 사용해야 합니다. o3-mini는 오늘부터 API 사용 등급 3-5에 해당하는 선택된 개발자들에게 Chat Completions API, Assistants API, Batch API를 통해 제공됩니다.
ChatGPT Plus, Team, Pro 사용자들은 오늘부터 OpenAI o3-mini에 접근할 수 있으며, Enterprise 사용자는 2월부터 이용할 수 있습니다. o3-mini는 모델 선택기에서 OpenAI o1-mini를 대체하며, 더 높은 속도 제한과 낮은 지연시간을 제공하여 코딩, STEM 및 논리적 문제 해결 작업에 매우 적합한 선택지가 됩니다. 이번 업그레이드의 일환으로 Plus와 Team 사용자의 경우, o1-mini에서 하루 50메시지였던 속도 제한이 o3-mini에서는 하루 150메시지로 3배 증가됩니다. 또한, o3-mini는 최신 웹 소스에 대한 링크와 함께 최신 답변을 찾기 위해 검색 기능과 연동됩니다. 이는 당사의 모든 추론 모델에 검색 기능을 통합하기 위한 초기 프로토타입입니다.
오늘부터 무료 플랜 사용자들도 메시지 작성 도구에서 ‘Reason’을 선택하거나 응답을 재생성함으로써 OpenAI o3-mini를 사용해 볼 수 있습니다. 이는 ChatGPT에서 추론 모델이 무료 사용자에게 제공된 첫 사례입니다.
OpenAI o1은 여전히 일반 지식 추론 모델로 남아 있지만, OpenAI o3-mini는 정밀성과 속도가 요구되는 기술 분야에 특화된 대안을 제공합니다. ChatGPT에서는 o3-mini가 중간 수준의 추론 노력을 사용하여 속도와 정확성 사이의 균형을 맞춥니다. 모든 유료 사용자는 모델 선택기에서 응답 생성에 다소 시간이 걸리지만 높은 지능을 제공하는 o3-mini-high 버전을 선택할 수 있으며, Pro 사용자는 o3-mini와 o3-mini-high 모두에 무제한으로 접근할 수 있습니다.
빠르고 강력하며 STEM 추론에 최적화됨
OpenAI o1의 후속 모델인 OpenAI o3-mini는 STEM 추론에 최적화되었습니다. 중간 수준의 추론 노력을 사용하는 o3-mini는 수학, 코딩, 과학 분야에서 o1의 성능에 필적하면서도 더 빠른 응답을 제공합니다. 전문 테스터들의 평가 결과, o3-mini는 OpenAI o1-mini보다 더 정확하고 명확한 답변을 제공하며, 더 강력한 추론 능력을 보였습니다. 테스터들은 o3-mini의 응답을 56%의 경우 선호했으며, 어려운 실제 문제에 대해서는 주요 오류가 39% 감소한 것으로 나타났습니다. 중간 수준의 추론 노력을 통해 o3-mini는 AIME와 GPQA를 포함한 가장 까다로운 추론 및 지능 평가에서 o1의 성능에 부합합니다.
모델 속도 및 성능
OpenAI o1과 유사한 지능을 갖춘 OpenAI o3-mini는 더욱 빠른 성능과 향상된 효율성을 자랑합니다. 앞서 언급한 STEM 평가 외에도, o3-mini는 중간 수준의 추론 노력을 사용하여 추가적인 수학 및 사실성 평가에서도 우수한 결과를 보입니다. A/B 테스트 결과, o3-mini는 o1-mini보다 24% 더 빠른 응답을 제공했으며, 평균 응답 시간은 7.7초로 o1-mini의 10.16초보다 단축되었습니다.
안전성
OpenAI o3-mini가 안전하게 응답할 수 있도록 교육하기 위해 사용한 주요 기술 중 하나는 **신중한 정렬(deliberative alignment)**입니다. 이는 모델이 사용자 프롬프트에 응답하기 전에 사람이 작성한 안전 사양을 기반으로 추론하도록 훈련하는 방식입니다. OpenAI o1과 마찬가지로, o3-mini는 도전적인 안전 및 탈옥 평가에서 GPT-4o를 크게 능가하는 것으로 나타났습니다. 배포 전에 o3-mini의 안전 위험을 OpenAI o1과 동일한 대비, 외부 레드팀 평가 및 안전 평가 방법을 사용하여 신중하게 검토하였습니다. 초기 접근 테스트에 지원해주신 안전 테스터들에게 감사드리며, 평가 세부 사항과 잠재적 위험 및 저희 완화 조치의 효과에 대한 포괄적인 설명은 o3-mini 시스템 카드에서 확인할 수 있습니다.
앞으로의 계획
OpenAI o3-mini의 출시는 비용 효율적인 인공지능의 경계를 확장하려는 OpenAI 사명의 또 다른 진전입니다. 비용을 낮게 유지하면서 STEM 분야의 추론을 최적화함으로써 고품질 AI를 더욱 많은 사람들이 활용할 수 있도록 하고 있습니다. 이 모델은 GPT-4 출시 이후 토큰당 가격을 95%까지 인하하며 최고 수준의 추론 능력을 유지해 온 당사의 비용 절감 기록을 이어갑니다. 인공지능 채택이 확대됨에 따라, 우리는 지능, 효율성 및 안전성을 균형 있게 갖춘 모델을 대규모로 구축하며 최전선에서 리더십을 발휘할 것을 약속합니다.
'배움: MBA, English, 운동' 카테고리의 다른 글
DeepSeek R1 로컬 실행 가이드 (9) | 2025.02.02 |
---|---|
AI가 창조하는 새로운 웹의 미래, Genspark Sparkpage (10) | 2025.02.02 |
AI 업무 보조 전쟁: ChatGPT vs. Claude vs. DeepSeek, 최고의 AI 비서는? (5) | 2025.02.02 |
1조 9,000억 원 규모 한국형 전자전기 사업, KAI와 대한항공의 치열한 경쟁! (14) | 2025.02.01 |
딥시크 (Deepseek) - AI 디스틸레이션(AI Distillation)과 OpenAI의 미래 (13) | 2025.02.01 |