본문 바로가기
배움: MBA, English, 운동

AMD, AI 시장에서 엔비디아에 도전장 - 신형 AI 칩 ‘Instinct MI325X’ 발표

by Heedong-Kim 2024. 10. 12.

최근 인공지능(AI) 기술의 발전과 함께, AI 칩 시장은 급격한 성장세를 보이고 있습니다. 이 시장에서 **엔비디아(Nvidia)**는 **AI 전용 GPU(그래픽 처리 장치)**를 통해 지배적인 위치를 차지하고 있으며, 80% 이상의 시장 점유율을 확보하고 있습니다. 이에 대응하기 위해 반도체 업계의 또 다른 주요 기업인 **AMD(Advanced Micro Devices)**는 새로운 AI 칩을 출시하며 엔비디아와의 경쟁에 본격적으로 뛰어들었습니다. AMD는 최근 Instinct MI325X라는 차세대 AI 칩을 공개하며, 엔비디아의 최신 칩과 성능 면에서 우위를 주장했지만, 시장의 반응은 다소 냉랭했습니다.

 

이번 발표는 AI 칩 시장에서 AMD의 전략적 도전을 의미하며, 특히 메모리 용량과 대역폭에서 엔비디아의 경쟁 제품을 능가한다는 점을 강조했습니다. 그러나 엔비디아의 CUDA 생태계라는 강력한 소프트웨어 플랫폼과 하드웨어의 종합적인 성능에서 엔비디아를 뛰어넘는 것이 AMD의 가장 큰 도전 과제로 남아있습니다. 이러한 배경에서, 이번 발표에 대한 시장의 반응과 AMD가 직면한 과제들에 대해 보다 심도 깊게 살펴볼 필요가 있습니다.

 

새로운 AI 칩 ‘Instinct MI325X’의 특징

AMD가 발표한 ‘Instinct MI325X’는 기존 제품인 ‘MI300X’의 후속 제품으로, 2024년 말부터 양산을 시작할 계획입니다. AMD는 이번 칩이 엔비디아의 최신 AI 칩인 ‘H200’과 비교해 메모리 용량은 1.8배, 대역폭은 1.3배 더 높다고 강조했습니다. 특히 메타의 ‘라마 3.1 모델’에서는 엔비디아의 H200보다 최대 40% 더 뛰어난 추론 성능을 보였다고 밝혔습니다. 이로 인해, 콘텐츠 생성 및 예측에 있어서 더 나은 성능을 발휘할 것으로 기대됩니다.

 

1. 메모리 용량과 대역폭의 개선

AMD는 MI325X가 엔비디아의 최신 칩인 H200과 비교해 메모리 용량이 1.8배, 대역폭이 1.3배 더 높다고 밝혔습니다. 이러한 성능 향상은 대규모 AI 모델이 더욱 복잡한 데이터셋을 처리하는 데 필수적인 요소입니다. 대용량 메모리와 확장된 대역폭 덕분에 더 많은 데이터를 동시에 처리할 수 있어 고급 AI 모델이 필요로 하는 데이터를 원활하게 지원할 수 있습니다.

2. 추론 성능의 향상

AMD는 MI325X가 특히 AI 모델의 추론(Inference) 성능에서 강점을 가지고 있다고 강조했습니다. 추론은 AI 모델이 학습된 데이터를 바탕으로 실제 예측을 수행하는 과정으로, 많은 AI 응용 프로그램에서 결정적인 역할을 합니다. AMD는 이 칩이 **메타의 ‘라마 3.1 모델(LLaMA 3.1)’**에서 엔비디아의 H200보다 최대 40% 더 높은 추론 성능을 보인다고 설명했습니다. 특히, 콘텐츠 생성 및 예측 작업에서 더 뛰어난 성능을 제공하여, 생성형 AI와 같은 응용 프로그램에서 탁월한 성능을 발휘할 것으로 기대됩니다.

3. 대규모 AI 모델 처리 최적화

Instinct MI325X는 AI 모델이 대규모 데이터를 처리할 때보다, 콘텐츠를 생성하거나 예측하는 데에 더 특화된 성능을 발휘합니다. 이는 **대규모 언어 모델(LLM)**이나 생성형 AI가 급속히 확산되고 있는 시장의 요구에 맞춘 최적화된 기능으로, AMD는 이를 통해 엔비디아와의 차별화를 꾀하고 있습니다.

4. 차세대 메모리 아키텍처

이 칩은 기존 MI300X와 동일한 아키텍처를 기반으로 하고 있지만, 더 나은 성능을 제공하기 위해 새로운 유형의 메모리 기술을 도입했습니다. 이로 인해 AI 계산에서 메모리 병목 현상을 줄여 더 빠른 데이터 처리가 가능해졌습니다. 특히, 고성능 컴퓨팅(HPC) 환경에서 중요한 성능 향상 요소로 작용하며, AI 모델이 필요로 하는 방대한 데이터를 처리하는 데 최적화되어 있습니다.

5. AI 모델 전환 용이성

AMD는 엔비디아의 AI 프로그래밍 언어인 **쿠다(CUDA)**가 AI 개발자들 사이에서 표준으로 자리 잡고 있어, 많은 개발자들이 엔비디아 생태계에 머무르고 있는 상황을 인지하고 있습니다. 이를 극복하기 위해 AMD는 자체 소프트웨어 플랫폼 ROCm을 개선하여 AI 개발자들이 더 쉽게 AMD의 AI 칩으로 모델을 전환할 수 있도록 했습니다. 이 플랫폼 개선을 통해 엔비디아 생태계에서 탈피하려는 AI 개발자들에게 대안을 제시하고 있습니다.

6. 향후 계획과 시장 목표

AMD는 MI325X를 시작으로, 2025년 MI350을, 2026년에는 MI400을 출시할 계획을 밝혔습니다. 이로써 AMD는 AI 칩의 시장 점유율을 늘리기 위한 중장기적인 계획을 세우고 있으며, AI 수요가 지속적으로 증가할 것이라는 리사 수 CEO의 발언과 함께 미래 AI 시장에 대한 큰 기대를 가지고 있습니다.

 

 

AMD의 전략과 도전

AMD는 AI 칩 분야에서 엔비디아의 독보적인 위치를 따라잡기 위해 소프트웨어 개선에도 집중하고 있습니다. 엔비디아의 AI 프로그래밍 언어인 '쿠다(CUDA)'가 사실상 표준으로 자리 잡고 있어, AMD는 자사의 소프트웨어 플랫폼인 ROCm을 개선해 AI 개발자들이 더 쉽게 AMD AI 칩으로 전환할 수 있도록 하겠다고 발표했습니다.

 

이와 함께 AMD는 서버용 CPU 시장에서 인텔과의 경쟁도 강화하고 있습니다. AMD의 최신 서버용 CPU ‘EPYC 5세대’는 인텔의 서버 칩 ‘제온’에 비해 성능 면에서 앞서 있다고 평가받고 있으며, 이를 통해 서버 프로세서 시장에서 점유율을 확대하려는 전략을 펼치고 있습니다.

 

1. AI 칩 시장에서의 경쟁

AMD는 AI 칩 시장에서 엔비디아의 지배적인 위치를 견제하기 위해 Instinct MI325X를 출시했습니다. 엔비디아는 AI용 그래픽 처리 장치(GPU) 시장에서 80% 이상의 점유율을 차지하고 있으며, CUDA라는 AI 프로그래밍 언어로 강력한 생태계를 구축하고 있습니다. 이로 인해 많은 AI 개발자들이 엔비디아의 하드웨어와 소프트웨어에 의존하고 있는 상황입니다.

 

AMD는 성능기술적 혁신을 통해 이 격차를 좁히려 하고 있으며, Instinct MI325XH200과 비교해 메모리 용량과 대역폭에서 우위를 점한다고 발표했습니다. AMD는 이 칩이 엔비디아의 차세대 칩인 블랙웰과도 경쟁할 수 있을 것으로 보고 있으며, AI 모델의 추론 성능에서 특히 더 뛰어난 성능을 제공할 수 있다는 점을 강조하고 있습니다.

 

그러나, 시장에서의 성공은 단순히 하드웨어 성능만으로 결정되는 것이 아닙니다. 엔비디아는 생태계 구축을 통해 AI 개발자들을 자사 플랫폼에 묶어두는 전략을 취하고 있습니다. 이에 맞서 AMD는 자사의 ROCm 소프트웨어 플랫폼을 개선하여, AI 개발자들이 쉽게 엔비디아의 CUDA 생태계를 벗어나 AMD 칩으로 전환할 수 있도록 하는 데 집중하고 있습니다.

2. 서버 CPU 시장에서의 도전

AMD는 AI 칩뿐만 아니라 서버 CPU 시장에서도 인텔을 견제하기 위해 신제품을 내놓고 있습니다. AMD의 최신 EPYC 5세대 서버 CPU는 인텔의 제온 시리즈와 직접적으로 경쟁할 수 있는 성능을 갖추고 있으며, 비디오 트랜스코딩과 같은 작업에서 인텔 제품보다 4배나 빠른 성능을 제공한다고 밝혔습니다. 특히, 저전력에서 고성능 슈퍼컴퓨터용 CPU까지 다양한 라인업을 갖추고 있어, 여러 가격대와 성능 요구를 충족시킬 수 있는 포트폴리오 전략을 취하고 있습니다.

 

서버 CPU 시장에서 인텔은 여전히 70% 이상의 점유율을 차지하고 있지만, AMD는 최근 몇 년 동안 시장에서 점유율을 빠르게 확대하고 있습니다. 특히 클라우드 컴퓨팅데이터 센터 시장에서 AMD는 인텔과의 격차를 줄여가고 있으며, 이번 EPYC 5세대는 그 경쟁력을 더욱 강화하는 역할을 할 것입니다.

3. 소프트웨어와 생태계 강화

AMD의 가장 큰 도전 과제 중 하나는 소프트웨어 생태계입니다. AI 칩 시장에서 성공하려면 하드웨어 성능뿐만 아니라, 그 성능을 최대한 활용할 수 있는 소프트웨어와 이를 지원하는 개발자 생태계가 필수적입니다. 엔비디아의 CUDA가 AI 업계의 사실상 표준으로 자리 잡은 상황에서, AMD는 자체 소프트웨어 플랫폼 ROCm을 개선하여 AI 개발자들이 쉽게 전환할 수 있는 환경을 제공하려고 노력하고 있습니다.

 

AMD의 전략은 개방형 생태계를 지향하며, ROCm 플랫폼을 통해 다양한 AI 모델과 애플리케이션이 AMD 칩에서도 원활하게 작동하도록 하는 것을 목표로 하고 있습니다. 이를 통해 AI 개발자 커뮤니티와의 협업을 강화하고, 엔비디아의 강력한 생태계에 대응하고자 합니다.

4. TSMC와의 협력 강화

AMD는 칩 제조에서 **TSMC(대만 반도체 제조 회사)**와의 협력을 지속적으로 강화하고 있습니다. 리사 수 AMD CEO는 최신 AI 칩 생산에 있어 TSMC 외에 다른 제조업체를 고려하지 않고 있으며, TSMC의 애리조나 공장에도 관심을 갖고 있다고 언급했습니다. 이는 안정적인 칩 공급망을 확보하고, 대만에 지나치게 의존하지 않기 위한 전략의 일환으로 볼 수 있습니다.

 

AMD는 TSMC와의 협력을 통해 고급 공정을 활용한 AI 칩 생산을 이어갈 예정이며, 이를 통해 성능과 효율성을 더욱 높일 계획입니다. 제조 공정의 최적화는 향후 AI 칩 경쟁에서 매우 중요한 요소로 작용할 것입니다.

5. AI 시장 수요 대응

리사 수 CEO는 AI 칩에 대한 수요 증가가 예상보다 빠르게 이루어지고 있다고 언급했습니다. 2028년까지 AI 칩 시장 규모가 5000억 달러에 달할 것으로 전망되며, AMD는 이 거대한 시장에서 성장 기회를 잡기 위해 적극적인 투자를 계속할 계획입니다. 또한, AMD는 AI 칩 관련 매출 목표를 기존 40억 달러에서 45억 달러로 상향 조정하며, AI 시장 내에서의 성장을 더욱 가속화할 것입니다.

 

시장 반응과 앞으로의 과제

AMD가 발표한 신형 칩이 AI 시장에 미치는 영향은 매우 중요하지만, 시장의 반응은 아직까지는 다소 냉담한 편입니다. 이번 발표 내용이 이미 많은 부분에서 예측되었고, 경쟁사인 엔비디아의 신형 칩 ‘블랙웰’에 비해 기술적인 위협이 크지 않다는 평가가 나왔기 때문입니다. AMD가 엔비디아에 비해 기술적으로 1년 뒤쳐져 있다는 분석도 존재하며, 이에 따라 주가가 4% 가까이 하락했습니다.

 

1. 시장 반응의 원인: 기대를 뛰어넘지 못한 발표

AMD의 이번 신제품 발표는 시장에서 냉랭한 반응을 이끌어냈습니다. 주요 원인으로는 이미 2023년 초부터 예측되었던 기술적 발전을 바탕으로 한 발표였기 때문입니다. 즉, 시장은 이번 발표에서 기대 이상의 혁신을 원했으나, 그에 미치지 못했다는 평가를 받았습니다.

 

또한, 엔비디아의 H200이나 차세대 칩인 블랙웰에 비해 MI325X가 기술적 위협이 되지 않을 것이라는 평가도 있었습니다. 엔비디아의 독점적인 지위와 CUDA 생태계는 단순한 하드웨어 성능을 넘어서 개발자와 소프트웨어 인프라에서의 강력한 장악력을 가지고 있기 때문에, AMD가 이를 뛰어넘기 위한 추가적인 전략이 필요하다는 지적이 나오고 있습니다.

2. 기술적 도전: 소프트웨어 생태계의 부족

AMD가 AI 칩 시장에서 엔비디아에 비해 뒤쳐져 있는 가장 큰 이유 중 하나는 소프트웨어 생태계입니다. 엔비디아의 CUDA는 AI 업계에서 사실상의 표준으로 자리 잡았으며, 이는 많은 AI 개발자들이 엔비디아 하드웨어를 선호하게 만드는 주요 요인 중 하나입니다. 엔비디아는 CUDA를 통해 락인(Lock-in) 효과를 극대화하여, AI 연구 및 개발에 필요한 도구와 프레임워크를 제공하며, 이를 통해 시장 점유율을 확대해왔습니다.

 

이에 반해, AMD는 ROCm이라는 자사의 소프트웨어 플랫폼을 보유하고 있지만, CUDA만큼 성숙하거나 광범위하게 사용되지 않고 있습니다. AMD가 엔비디아와의 기술적 격차를 줄이기 위해서는 ROCm의 성능과 사용성을 개선하고, 더 많은 AI 개발자들이 이 플랫폼을 활용하도록 유도해야 합니다. 이는 생태계 구축에 있어 AMD가 해결해야 할 중요한 과제 중 하나입니다.

3. 하드웨어 성능과 혁신의 필요성

AMD의 MI325X는 엔비디아 H200에 비해 메모리 용량과 대역폭에서 우위를 점하고 있지만, 전체적인 성능에서는 여전히 미흡하다는 평가를 받고 있습니다. 엔비디아는 AI 하드웨어와 소프트웨어 모두에서 강력한 리더십을 발휘하고 있으며, 특히 추론(Inference) 성능에서 AMD가 뛰어난 성능을 보여주었음에도 불구하고, 시장은 종합적인 성능 개선을 더 중요하게 평가하고 있습니다.

 

또한, 엔비디아는 지속적으로 신제품을 출시하며 기술 혁신을 주도하고 있으며, AI 시장의 다양한 요구에 대응하기 위해 고성능, 저전력 등 다양한 제품군을 선보이고 있습니다. AMD 역시 이러한 시장 요구에 부합하는 다양한 제품 포트폴리오를 강화해야 하며, 향후 출시 예정인 MI350MI400 시리즈에서 보다 혁신적인 기술을 보여줄 필요가 있습니다.

4. 시장 점유율 확대의 어려움

AI 칩 시장에서 엔비디아의 시장 점유율은 80% 이상을 차지하고 있으며, AMD는 여전히 이 시장에서 뒤쳐져 있습니다. AI 칩 시장에서 성공하기 위해서는 단순히 하드웨어 성능을 넘어, AI 솔루션을 통합적으로 제공할 수 있는 생태계 구축이 필수적입니다. 이는 AI 개발자와 기업들이 쉽게 접근할 수 있는 개발 도구지원 플랫폼을 요구하며, AMD가 이를 구축하는 데 시간이 필요할 수 있습니다.

 

또한, 시장에서는 서버 CPU 시장에서도 인텔이 여전히 우위를 점하고 있다는 점에서, AMD가 인텔을 상대로 성과를 거두기 위해서는 기술적 우위를 더욱 명확히 증명해야 한다는 지적이 있습니다. AMD는 EPYC 시리즈를 통해 인텔의 시장을 침투하고 있지만, 전체 시장 점유율을 확대하기 위해서는 클라우드 서비스 제공자데이터 센터와 같은 대규모 고객층을 더욱 끌어들여야 할 것입니다.

5. 성공을 위한 과제와 전략

AMD가 AI와 서버 CPU 시장에서 성공하기 위해서는 다음과 같은 과제를 해결해야 합니다.

  1. 소프트웨어 생태계 강화: AMD는 ROCm 플랫폼을 지속적으로 개선하고, AI 개발자들이 엔비디아의 CUDA에서 쉽게 전환할 수 있는 환경을 제공해야 합니다. 이는 AI 시장에서 개발자들의 신뢰를 얻는 핵심 요소가 될 것입니다.
  2. 하드웨어 혁신 가속화: 엔비디아의 강력한 경쟁 제품에 대응하기 위해 더욱 혁신적인 기술향상된 성능을 제공해야 합니다. 이는 추론 성능뿐만 아니라 종합적인 AI 처리 성능에서 경쟁력을 증명하는 것이 중요합니다.
  3. 시장 점유율 확대 전략: AMD는 AI와 서버 시장에서 대규모 고객 확보를 위해 포트폴리오 전략을 강화해야 합니다. 특히 클라우드 서비스 제공자대규모 데이터 센터와의 협력을 강화하여, AI 칩과 서버 CPU의 점유율을 확대하는 데 주력해야 합니다.
  4. 파트너십 및 제조 전략: TSMC와의 긴밀한 협력을 통해 안정적인 칩 공급망을 확보하고, AI 칩 생산을 최적화하는 것이 필요합니다. 또한, TSMC의 미국 공장과 같은 새로운 제조 옵션을 통해 지리적 리스크를 줄이는 전략도 중요합니다.

 

결론

AMD는 이번 Instinct MI325X 발표를 통해 AI 칩 시장에서 엔비디아의 독점적 지위에 도전하려는 의지를 분명히 했습니다. 특히 메모리 용량과 대역폭에서 우수한 성능을 강조하며 AI 추론 성능에서 경쟁 우위를 확보하려고 했습니다. 그러나, 시장의 반응은 기대에 미치지 못한 혁신이미 예측된 기술 발전에 대한 실망감으로 주가 하락으로 이어졌습니다. 이는 단순히 하드웨어 성능만으로는 엔비디아와 같은 강력한 생태계를 가진 경쟁자를 따라잡는 데 한계가 있음을 보여줍니다.

 

AMD가 AI 칩 시장에서 성공하기 위해서는 ROCm 소프트웨어 생태계의 강화, AI 개발자들의 전환 유도, 그리고 기술 혁신의 가속화가 필요합니다. 또한 서버 CPU 시장에서는 인텔과의 경쟁을 통해 점유율을 확대하고, 클라우드 및 데이터센터 시장에서의 성공을 기반으로 장기적인 성장 전략을 마련해야 합니다. AMD가 이러한 과제를 해결하고, AI 칩 및 서버 CPU 시장에서 경쟁력을 지속적으로 강화한다면, 향후 몇 년 내에 AI 및 서버 시장에서의 점유율을 크게 확대할 가능성이 있습니다.

 

AMD가 AI와 서버 CPU 분야에서 성장 잠재력을 갖추고 있는 것은 분명하지만, 이를 실현하기 위해서는 현재의 기술적 도전과 시장의 기대를 충족시킬 수 있는 지속적인 혁신과 전략적 대응이 필요합니다.