본문 바로가기
배움: MBA, English, 운동

구글 Gemini 1.5 Pro 모델 출시

by Heedong-Kim 2024. 10. 6.

2024.9.24

 

 

오늘, 우리는 두 가지 업데이트된 프로덕션 준비 완료 Gemini 모델인 Gemini-1.5-Pro-002와 Gemini-1.5-Flash-002를 출시합니다. 이번 출시와 함께 제공되는 주요 사항은 다음과 같습니다:

  • 1.5 Pro의 가격이 50% 인하되었습니다 (입력 및 출력 토큰이 128K 미만일 경우).
  • 1.5 Flash는 2배, 1.5 Pro는 약 3배의 더 높은 요청 한도가 적용되었습니다.
  • 출력 속도가 2배 빨라졌고, 지연 시간이 3배 줄어들었습니다.
  • 기본 필터 설정이 업데이트되었습니다.

이 새로운 모델들은 Google I/O 2023년 5월에 발표된 Gemini 1.5 모델의 최신 실험 모델 출시 기반 위에 유의미한 개선을 더한 것입니다. 개발자들은 Google AI Studio와 Gemini API를 통해 무료로 최신 모델에 액세스할 수 있으며, 대규모 기업과 Google Cloud 고객들은 Vertex AI를 통해 이용할 수 있습니다.

 

 

전반적인 품질 개선, 수학, 긴 컨텍스트, 비전에서 큰 향상

 

Gemini 1.5 시리즈는 다양한 텍스트, 코드, 멀티모달 작업에서 전반적인 성능을 목표로 설계된 모델입니다. 예를 들어, Gemini 모델은 1000페이지짜리 PDF에서 정보를 합성하고, 1만 줄 이상의 코드가 포함된 리포지토리에 대한 질문에 답변하며, 1시간짜리 동영상을 받아 유용한 콘텐츠를 생성하는 등의 작업을 수행할 수 있습니다.

 

이번 업데이트를 통해 1.5 Pro와 Flash 모델은 더 나은 성능을 발휘하며, 프로덕션 구축에 있어 더 빠르고 비용 효율적으로 개선되었습니다. MMLU-Pro라는 더 어려운 벤치마크에서는 약 7%의 성능 향상을 보였고, 수학(MATH) 및 HiddenMath(내부 보류된 경쟁 수학 문제 세트) 벤치마크에서는 두 모델 모두 약 20%의 상당한 개선을 이루었습니다. 비전 및 코드 사용 사례에서도 두 모델은 시각적 이해와 Python 코드 생성 성능이 각각 2~7% 개선되었습니다.

 

 

또한 모델 응답의 전반적인 유용성을 향상시켰으며, 콘텐츠 안전 정책과 표준을 계속해서 준수하고 있습니다. 이를 통해 많은 주제에서 더 유용한 응답을 제공할 수 있게 되었으며, 거부 사례가 줄어들었습니다.

 

가격 인하와 향상된 기능

 

Gemini 1.5 Pro 모델의 경우 64%의 입력 토큰 가격 인하, 출력 토큰 가격의 52% 인하, 그리고 캐시된 토큰의 64% 가격 인하가 적용됩니다. 이로 인해 Gemini를 이용한 구축 비용이 더욱 절감됩니다.

 

 

요청 한도 증가

 

개발자들이 더 쉽게 Gemini를 활용할 수 있도록 1.5 Flash는 분당 2,000 RPM, 1.5 Pro는 분당 1,000 RPM으로 요청 한도가 증가했습니다. 앞으로도 계속해서 Gemini API의 요청 한도를 증가시킬 계획입니다.

 

2배 더 빠른 출력과 3배 더 낮은 지연 시간

 

최근 몇 주 동안, 1.5 Flash 모델의 지연 시간이 크게 줄어들었으며, 초당 출력 토큰 수가 크게 증가하여 더 많은 새로운 사용 사례를 지원할 수 있게 되었습니다.

 

 

업데이트된 필터 설정

 

Gemini 모델이 2023년 12월에 처음 출시된 이후로, 안전하고 신뢰할 수 있는 모델을 구축하는 것이 중요한 과제가 되어왔습니다. 최신 Gemini 모델(-002 모델)에서는 사용자 지침을 더 잘 따르면서도 안전성을 유지하는 데에 있어서 개선이 이루어졌습니다. 이번에 출시된 모델에서는 기본적으로 필터가 적용되지 않으며, 개발자가 그들의 사용 사례에 적합한 설정을 결정할 수 있습니다.

 

Gemini 1.5 Flash-8B 실험적 업데이트

 

우리는 2024년 8월에 발표한 Gemini 1.5 모델의 개선 버전인 "Gemini-1.5-Flash-8B-Exp-0924"를 추가로 출시합니다. 이 개선된 버전은 텍스트 및 멀티모달 사용 사례 전반에서 상당한 성능 향상을 포함하고 있습니다. 이 모델은 현재 Google AI Studio 및 Gemini API를 통해 이용할 수 있습니다.

 

개발자들이 1.5 Flash-8B에 대해 보내준 긍정적인 피드백에 힘입어, 앞으로도 개발자들의 피드백을 바탕으로 실험적 모델에서 프로덕션 릴리스까지의 파이프라인을 계속해서 조정해 나갈 계획입니다.

 

우리는 이번 업데이트에 매우 흥분하고 있으며, 여러분이 새로운 Gemini 모델을 활용해 무엇을 만들지 기대하고 있습니다! Gemini Advanced 사용자들은 곧 Gemini 1.5 Pro-002의 채팅 최적화 버전을 이용할 수 있게 될 것입니다.