본문 바로가기
배움: MBA, English, 운동

Llama 3.1 소개: 지금까지 가장 강력한 모델

by Heedong-Kim 2024. 7. 24.

요약:

  • Meta는 공개 접근 가능한 AI에 전념하고 있습니다. 공개 소스가 개발자, Meta, 그리고 세계에 왜 좋은지에 대한 마크 저커버그의 편지를 읽어보세요.
  • 새로운 모델들은 컨텍스트 길이를 128K로 확장하고, 8개 언어를 지원하며, 최초의 프론티어급 공개 소스 AI 모델인 Llama 3.1 405B를 포함합니다.
  • Llama 3.1 405B는 독보적인 유연성, 제어력, 최첨단 기능을 갖추고 있으며, 최고의 폐쇄형 모델들과 경쟁합니다. 이 새로운 모델은 합성 데이터 생성 및 모델 증류와 같은 새로운 워크플로를 커뮤니티에 제공할 것입니다.
  • 우리는 모델과 함께 작동하는 더 많은 구성 요소를 제공하여 Llama를 시스템으로 구축하고 있습니다. 개발자가 자신만의 맞춤형 에이전트와 새로운 유형의 에이전트 행동을 만들 수 있도록 도구를 제공하고자 합니다. 이를 책임 있게 구축할 수 있도록 Llama Guard 3 및 Prompt Guard와 같은 새로운 보안 및 안전 도구를 강화하고 있습니다. 또한 Llama Stack API에 대한 요청 의견을 발표하여 타사 프로젝트가 Llama 모델을 쉽게 활용할 수 있도록 표준 인터페이스를 제공하고자 합니다.
  • AWS, NVIDIA, Databricks, Groq, Dell, Azure, Google Cloud, Snowflake 등 25개 이상의 파트너가 첫날부터 서비스를 제공합니다.
  • WhatsApp과 meta.ai에서 도전적인 수학 또는 코딩 질문을 하여 미국에서 Llama 3.1 405B를 사용해 보세요.

ai.meta.com/blog/meta-llama-3-1

새로운 시대의 도래

오늘날까지 공개 소스 대형 언어 모델은 기능과 성능 면에서 폐쇄형 모델에 뒤쳐져 있었습니다. 이제 우리는 공개 소스가 선도하는 새로운 시대를 맞이하고 있습니다. 우리는 세계에서 가장 크고 강력한 공개 가능한 기반 모델인 Meta Llama 3.1 405B를 공개적으로 출시합니다. 지금까지 모든 Llama 버전의 총 다운로드 수는 3억 회를 넘어서고 있으며, 이제 시작에 불과합니다.

Llama 3.1 소개

Llama 3.1 405B는 일반 지식, 조종 가능성, 수학, 도구 사용, 다국어 번역 등 최첨단 기능에서 최고의 AI 모델과 경쟁하는 최초의 공개 가능한 모델입니다. 405B 모델 출시와 함께 우리는 혁신을 가속화할 준비가 되어 있으며, 전례 없는 성장과 탐험의 기회를 제공합니다. 최신 Llama 세대는 합성 데이터 생성 및 모델 증류와 같은 새로운 애플리케이션과 모델링 패러다임을 점화할 것이라고 믿습니다.

이번 최신 릴리스의 일환으로, 우리는 8B 및 70B 모델의 업그레이드 버전을 소개합니다. 이 모델들은 다국어를 지원하며, 128K의 더 긴 컨텍스트 길이, 최첨단 도구 사용, 전반적으로 더 강력한 추론 능력을 갖추고 있습니다. 이를 통해 최신 모델들은 장문 텍스트 요약, 다국어 대화형 에이전트, 코딩 어시스턴트와 같은 고급 사용 사례를 지원할 수 있습니다. 우리는 또한 라이선스를 변경하여 개발자가 Llama 모델의 출력물을 다른 모델 개선에 사용할 수 있도록 허용했습니다. 공개 소스에 대한 우리의 헌신에 따라, 오늘부터 이러한 모델들을 커뮤니티에 다운로드할 수 있도록 llama.meta.com 및 Hugging Face에서 제공하며, 우리의 파트너 플랫폼에서 즉시 개발할 수 있습니다.

모델 평가

이번 릴리스에서는 다양한 언어를 아우르는 150개 이상의 벤치마크 데이터셋에서 성능을 평가했습니다. 또한 Llama 3.1을 실제 시나리오에서 경쟁 모델과 비교하는 광범위한 인간 평가를 수행했습니다. 우리의 실험적 평가에 따르면, 우리의 주력 모델은 GPT-4, GPT-4o, Claude 3.5 Sonnet을 포함한 주요 기반 모델과 다양한 작업에서 경쟁력이 있습니다. 또한 우리의 소형 모델들도 비슷한 수의 파라미터를 가진 폐쇄형 및 공개형 모델들과 경쟁할 수 있습니다.



모델 아키텍처

우리의 가장 큰 모델인 Llama 3.1 405B를 15조 개 이상의 토큰으로 훈련하는 것은 큰 도전이었습니다. 이 규모에서 훈련 실행을 가능하게 하고 합리적인 시간 내에 결과를 얻기 위해, 우리는 전체 훈련 스택을 크게 최적화하고 모델 훈련을 16,000개 이상의 H100 GPU로 확장하여 405B를 이 규모에서 처음으로 훈련된 Llama 모델로 만들었습니다.



이를 위해 우리는 모델 개발 과정을 확장 가능하고 단순하게 유지하는 데 중점을 둔 설계 선택을 했습니다. 표준 디코더 전용 트랜스포머 모델 아키텍처를 소규모 수정하여 훈련 안정성을 최대화했습니다. 반복적인 사후 훈련 절차를 채택하여 각 라운드에서 감독된 미세 조정 및 직접 선호 최적화를 사용했습니다. 이를 통해 각 라운드마다 최고 품질의 합성 데이터를 생성하고 각 기능의 성능을 향상시킬 수 있었습니다.

지침 및 채팅 미세 조정

Llama 3.1 405B에서는 사용자의 지침에 대한 모델의 도움, 품질 및 상세한 지침 준수 능력을 향상시키는 데 주력했습니다. 우리의 가장 큰 도전 과제는 더 많은 기능 지원, 128K 컨텍스트 창 및 증가한 모델 크기였습니다.

사후 훈련에서는 여러 라운드의 정렬을 통해 최종 채팅 모델을 생성합니다. 각 라운드는 감독된 미세 조정(SFT), 거부 샘플링(RS), 직접 선호 최적화(DPO)를 포함합니다. 합성 데이터 생성을 사용하여 대부분의 SFT 예제를 생성하며, 모든 기능에서 더 높은 품질의 합성 데이터를 생성하기 위해 여러 번 반복합니다. 또한 이러한 합성 데이터를 가장 높은 품질로 필터링하기 위해 여러 데이터 처리 기술에 투자합니다. 이를 통해 기능 전반에 걸쳐 미세 조정 데이터의 양을 확장할 수 있습니다.

Llama 시스템

Llama 모델은 외부 도구 호출을 포함한 여러 구성 요소를 조율할 수 있는 전체 시스템의 일부로 작동하도록 설계되었습니다. 우리의 비전은 기본 모델을 넘어 개발자가 자신의 비전에 맞춘 맞춤형 제안을 설계하고 만들 수 있도록 하는 것입니다. 작년에는 핵심 LLM 외부 구성 요소 통합을 처음 도입했습니다.

우리는 모델 계층을 넘어 AI를 책임감 있게 개발하고 다른 사람들이 그렇게 할 수 있도록 돕기 위해 Llama Guard 3, 다국어 안전 모델 및 Prompt Guard와 같은 새로운 구성 요소를 포함한 전체 참조 시스템을 공개합니다. 이러한 샘플 애플리케이션은 오픈 소스이며 커뮤니티가 구축할 수 있습니다.

우리는 이러한 구성 요소의 인터페이스를 더 잘 정의하기 위해 산업계, 스타트업 및 광범위한 커뮤니티와 협력하기 시작했습니다. 이를 지원하기 위해 GitHub에서 "Llama Stack"에 대한 요청 의견을 발표합니다. Llama Stack은 정형화된 도구 체인 구성 요소(미세 조정, 합성 데이터 생성) 및 에이전트 애플리케이션을 구축하는 방법에 대한 표준화된 인터페이스 세트입니다. 이러한 표준화가 생태계 전반에 채택되기를 바라며, 이는 상호 운용성을 더 쉽게 할 것입니다.

개방성이 혁신을 이끕니다

폐쇄형 모델과 달리 Llama 모델 가중치는 다운로드 가능합니다. 개발자는 모델을 완전히 맞춤화하고, 새로운 데이터셋으로 훈련하며, 추가 미세 조정을 수행할 수 있습니다. 이를 통해 더 넓은 개발자 커뮤니티와 전 세계가 생성 AI의 힘을 더 완전히 실현할 수 있습니다. 개발자는 애플리케이션을 맞춤화하고, 온프레미스, 클라우드 또는 로컬 랩톱에서 실행할 수 있습니다. 이러한 모든 과정에서 데이터를 Meta와 공유할 필요가 없습니다.

많은 사람들이 폐쇄형 모델이 더 비용 효율적이라고 주장할 수 있지만, Llama 모델은 업계에서 가장 낮은 토큰당 비용을 제공합니다. 마크 저커버그는 공개 소스를 통해 더 많은 사람들이 AI의 혜택과 기회를 누릴 수 있으며, 권력이 소수의 손에 집중되지 않고 기술이 사회 전반에 더 고르게 안전하게 배포될 수 있다고 언급했습니다. 그렇기 때문에 우리는 공개 접근 AI가 산업 표준이 되도록 계속 노력하고 있습니다.

우리는 과거 Llama 모델로 놀라운 것들을 구축한 커뮤니티를 보았습니다. 예를 들어, Llama와 함께 WhatsApp 및 Messenger에서 배포된 AI 학습 도우미, 임상 의사 결정을 돕는 의료 분야에 맞춘 LLM, 환자의 입원 정보를 조직하고 전달하는 것을 더 쉽게 만드는 브라질의 헬스케어 비영리 스타트업 등이 있습니다. 우리는 최신 모델을 통해 커뮤니티가 무엇을 구축할지 기대가 큽니다.

Llama 3.1 405B로 빌드하기

405B 규모의 모델을 사용하는 것은 일반 개발자에게 도전적일 수 있습니다. 우리는 커뮤니티와 대화하면서 생성 AI 개발에는 단순히 모델에 프롬프트를 제공하는 것 이상의 많은 것이 필요하다는 것을 깨달았습니다. 우리는 모든 사람들이 405B의 최대 잠재력을 활용할 수 있도록 돕고자 합니다.

 

 

오늘 Llama 3.1 모델 컬렉션을 사용해보세요

이 작업이 커뮤니티에 어떤 영향을 미칠지 기대됩니다. 다국어 지원과 늘어난 컨텍스트 길이를 활용해 새로운 유용한 경험을 구축할 수 있는 잠재력이 큽니다. Llama Stack과 새로운 안전 도구로, 우리는 공개 소스 커뮤니티와 함께 책임감 있게 계속 구축해 나가기를 기대합니다. 모델을 출시하기 전에, 우리는 레드 팀과 같은 여러 조치를 통해 잠재적 위험을 식별, 평가 및 완화합니다. 내부 및 외부 전문가들과의 광범위한 레드 팀 작업을 통해 모델을 스트레스 테스트하고 예상치 못한 사용 방법을 찾습니다.

이것은 우리의 가장 큰 모델이지만, 우리는 더 많은 장치를 지원하는 크기, 추가 모달리티, 에이전트 플랫폼 계층에 대한 더 많은 투자 등 미래에 탐험할 새로운 영역이 많이 남아 있다고 믿습니다. 커뮤니티가 이 모델로 구축할 모든 놀라운 제품과 경험을 기대하고 있습니다.

 

https://llama.meta.com/

 

Llama 3.1

The open source AI model you can fine-tune, distill and deploy anywhere. Our latest models are available in 8B, 70B, and 405B variants.

llama.meta.com

 

https://huggingface.co/collections/meta-llama/llama-31-669fc079a0c406a149a5738f

 

Llama 3.1 - a meta-llama Collection

This collection hosts the transformers and original repos of the Meta Llama 3.1, Llama Guard 3 and Prompt Guard models

huggingface.co