미세 조정 기능 (Fine-Tuning) - GPT-4o 맞춤형 버전의 성능과 정확도 향상

Aug 20, 2024

오늘부터 개발자들이 가장 많이 요청한 기능 중 하나인 GPT-4o의 미세 조정(fine-tuning)이 출시됩니다. 9월 23일까지 모든 조직에게 하루에 100만 개의 학습 토큰을 무료로 제공합니다.

개발자들은 이제 GPT-4o를 맞춤형 데이터셋으로 미세 조정하여 특정 사용 사례에 대해 더 높은 성능을 더 낮은 비용으로 얻을 수 있습니다. 미세 조정을 통해 모델은 응답의 구조와 어조를 맞춤화하거나 복잡한 도메인별 지침을 따를 수 있게 됩니다. 학습 데이터셋에 수십 개의 예시만으로도 개발자들은 이미 애플리케이션에 대해 강력한 결과를 얻을 수 있습니다.

코딩에서부터 창의적인 글쓰기까지, 미세 조정은 다양한 도메인에서 모델 성능에 큰 영향을 미칠 수 있습니다. 이것은 시작에 불과하며, 우리는 계속해서 개발자들을 위한 모델 커스터마이징 옵션을 확대할 예정입니다.

시작하기

GPT-4o 미세 조정은 오늘부터 모든 유료 사용 등급의 개발자에게 제공됩니다.

시작하려면 미세 조정 대시보드에서 "생성(create)"을 클릭한 후 기본 모델 드롭다운에서 "gpt-4o-2024-08-06"을 선택하십시오. GPT-4o 미세 조정 학습 비용은 백만 개의 토큰당 25달러이며, 추론 비용은 백만 개의 입력 토큰당 3.75달러, 백만 개의 출력 토큰당 15달러입니다.

GPT-4o 미니 미세 조정도 모든 유료 사용 등급의 개발자에게 제공됩니다. 미세 조정 대시보드에서 "gpt-4o-mini-2024-07-18"을 기본 모델 드롭다운에서 선택하십시오. GPT-4o 미니의 경우, 9월 23일까지 하루에 200만 개의 학습 토큰을 무료로 제공합니다.

미세 조정 사용 방법에 대해 자세히 알아보려면 문서를 참조하십시오.

https://platform.openai.com/docs/guides/fine-tuning

GPT-4o 미세 조정으로 최첨단 성능 달성

지난 몇 달 동안 우리는 신뢰할 수 있는 파트너들과 함께 GPT-4o 미세 조정을 테스트하고 그들의 사용 사례를 배웠습니다. 여기 몇 가지 성공 사례가 있습니다.

Cosine, SWE-bench 벤치마크에서 최첨단 결과 달성

Cosine의 Genie는 사용자가 협업하여 버그를 자율적으로 식별하고 해결하며, 기능을 구축하고 코드를 리팩터링할 수 있는 AI 소프트웨어 엔지니어링 어시스턴트입니다. Genie는 복잡한 기술 문제를 해결하고 더 높은 정확도와 적은 토큰으로 코드를 변경할 수 있습니다. Genie는 실제 소프트웨어 엔지니어들이 작업하는 예시를 학습하여 특정 방식으로 응답하는 법을 배우도록 GPT-4o 모델을 미세 조정했습니다. 또한 이 모델은 코드베이스에 쉽게 커밋할 수 있는 패치와 같은 특정 형식으로 출력할 수 있도록 학습되었습니다.

미세 조정된 GPT-4o 모델을 사용한 Genie는 지난 화요일 발표된 새로운 SWE-bench Verified 벤치마크에서 43.8%의 SOTA 점수를 달성했습니다. Genie는 또한 SWE-bench Full에서 30.08%의 SOTA 점수를 기록하며 이전 SOTA 점수인 19.27%를 넘어선, 이 벤치마크에서 최대 개선치를 기록했습니다.

Distyl, BIRD-SQL 벤치마크에서 1위 달성

Distyl은 Fortune 500대 기업의 AI 솔루션 파트너로, 최근 BIRD-SQL 벤치마크에서 1위를 차지했습니다. GPT-4o를 미세 조정한 Distyl은 리더보드에서 71.83%의 실행 정확도를 달성했으며, 쿼리 재구성, 의도 분류, 연쇄 사고, 자가 수정 등의 작업에서 뛰어난 성능을 보였으며, 특히 SQL 생성에서 높은 성능을 발휘했습니다.

데이터 프라이버시 및 안전성

미세 조정된 모델은 완전히 사용자의 제어 하에 있으며, 비즈니스 데이터의 모든 입력과 출력에 대한 전체 소유권을 가집니다. 이를 통해 사용자의 데이터가 다른 모델을 학습하는 데 사용되거나 공유되지 않도록 보장됩니다.

또한, 미세 조정된 모델이 오용되지 않도록 하기 위해 계층화된 안전 완화 조치를 구현했습니다. 예를 들어, 미세 조정된 모델에 대해 자동화된 안전 평가를 지속적으로 수행하고, 애플리케이션이 사용 정책을 준수하는지 모니터링합니다.

GPT-4o 미세 조정을 통해 어떤 것을 구축할지 기대됩니다. 모델 커스터마이징 옵션을 더 탐색하고 싶다면 팀에 연락하십시오. 기꺼이 도와드리겠습니다!

728x90

저작자표시 비영리 변경금지 (새창열림)

'배움: MBA, English, 운동' 카테고리의 다른 글

연준 의장 제롬 파월 (Fed Chair: Jerome Powell) 의 운명을 가를 중요한 순간이 다가오다 (1)	2024.08.24
한국 우주 산업의 도약: 기술 경쟁력과 미래 전망 (0)	2024.08.24
아파치 헬기 (AH-64E) 추가 도입: 필요한가, 불필요한가? (4)	2024.08.23
대한민국 AI 반도체의 새로운 장을 여는 사피온-리벨리온 합병 (0)	2024.08.19
퍼블리 (Publy) 7일 무료 체험 후기 (1)	2024.08.18

늘 배움을 찾아가는 Life Long Learner