본문 바로가기
배움: MBA, English, 운동

🤖 AI, 싸게 풀린다더니… 오히려 더 비싸졌다

by Heedong-Kim 2025. 9. 9.

AI가 더 똑똑해질수록 가격은 내려가고, 누구나 부담 없이 활용할 수 있을 것이라는 기대가 있었습니다. 하지만 현실은 정반대로 전개되고 있습니다. 단위당 비용(토큰 단가)은 분명히 떨어지고 있지만, 한 번의 작업에 필요한 토큰 수가 기하급수적으로 늘어나면서 최종 사용 비용은 오히려 치솟고 있는 것입니다. 이는 스타트업과 중소 개발사들에게 큰 부담으로 다가오고 있으며, AI 산업의 지속 가능성에 대한 새로운 논쟁을 불러일으키고 있습니다.

 

불과 몇 년 전까지만 해도 업계 전문가들과 투자자들은 AI가 발전할수록 비용이 급격히 낮아지고, 결국에는 **‘수도 요금처럼 신경 쓰지 않아도 되는 수준’**이 될 것이라고 예측했습니다. GPU 성능 개선, 클라우드 인프라 효율화, 모델 최적화가 맞물리며 단위당 비용은 계속 떨어지고 있었기 때문입니다. 그러나 실제 시장에서 벌어지고 있는 상황은 정반대입니다.

 

AI는 더 똑똑해졌지만, 그 대가로 토큰 사용량이 기하급수적으로 증가했습니다. 최신 모델은 단순히 질문에 답하는 데 그치지 않고, 스스로 여러 번 사고하며, 웹에서 자료를 검색하고, 작은 프로그램을 작성해 문제를 풀어냅니다. 이런 ‘추론(reasoning) 능력’은 응답 품질을 비약적으로 높여주지만, 동시에 사용량 폭증을 야기합니다.

 

결과적으로, AI 산업은 지금 **“단가는 낮아졌지만 총비용은 치솟는 모순적 현실”**에 직면해 있습니다. 이는 단순한 기술 발전의 문제가 아니라, 기업의 수익성, 스타트업 생태계, 소비자 행동 패턴까지 뒤흔드는 중대한 이슈로 떠오르고 있습니다.

 

 


📈 토큰 비용은 떨어져도, 총비용은 증가한다

AI의 ‘추론(Inference)’ 단가는 해마다 급격히 하락하고 있습니다. 예를 들어, 저사양 모델은 1년에 약 9배, 최고 사양 모델은 900배 가까이 비용이 줄어들었습니다. 그러나 문제는 AI가 더 깊이 생각할수록 사용하는 토큰 수가 폭증한다는 점입니다.

  • 기본 Q&A: 50~500 토큰
  • 문서 요약: 200~6,000 토큰
  • 복잡한 코드 작성: 2만~10만 토큰
  • 법률 문서 분석: 7만 5천~25만 토큰
  • 멀티스텝 에이전트 작업: 10만~100만 토큰 이상

즉, 단가 하락에도 불구하고 실제 청구되는 요금은 오히려 늘어나는 아이러니가 발생하고 있습니다.

 

AI 산업의 가장 큰 역설은 바로 단위당 비용의 하락과 총비용의 상승입니다. 토큰 단가는 분명히 급격히 내려가고 있습니다. 예컨대, 기본적인 대화형 모델은 불과 1년 만에 9배 가까이 저렴해졌고, 최고 성능 모델은 900배 이상 떨어졌습니다. 이는 GPU 최적화, 모델 경량화, 클라우드 인프라 효율화 등 기술적 진보 덕분입니다.

 

그러나 실제 현장에서 기업들이 지불하는 비용은 줄어들지 않고 있습니다. 이유는 간단합니다. 한 번의 요청을 처리하기 위해 필요한 토큰 수 자체가 기하급수적으로 늘어났기 때문입니다. 최신 AI는 단순히 질문에 답하는 수준을 넘어, 스스로 여러 번 사고하고, 웹을 탐색하며, 자체적인 코드를 작성해 계산까지 수행합니다. 이러한 과정은 답변의 정확성과 깊이를 높여주지만, 동시에 토큰 사용량을 폭발적으로 증가시킵니다.

예를 들어,

  • 단순 질의응답(Q&A)은 수십~수백 토큰으로 가능하지만,
  • 법률 문서 검토는 수십만 토큰,
  • 복잡한 멀티스텝 에이전트 작업은 수백만 토큰이 소모될 수 있습니다.

결국, **단가는 떨어지지만 사용량이 늘어나 총비용은 증가하는 ‘AI의 역설’**이 나타나고 있습니다. 이는 전기 요금의 kWh 단가는 낮아졌지만, 가전제품 사용량이 늘어나면서 가정의 전기요금이 줄지 않는 현상과 유사합니다.

 

이런 구조는 특히 스타트업과 중소기업에게 더 큰 타격을 줍니다. 예상보다 빨리 크레딧을 소진하거나, 고급 AI 기능을 활용할수록 수익성이 악화되기 때문입니다. 반면, 자본력이 충분한 빅테크 기업들은 이 같은 비용 구조를 감당할 수 있어, AI 산업의 격차 확대로 이어지고 있습니다.

 

 


💸 기업 수익성에 미치는 충격

노션(Notion)의 경우, 불과 2년 전만 해도 90%에 달했던 마진이 현재는 10%포인트가량 줄어들며 AI 제공업체에 돌아가고 있습니다. 코드 자동 생성 서비스를 제공하는 Cursor, Replit 같은 스타트업들은 이용자들의 토큰 소모가 예상보다 빠르게 증가하면서 가격 체계를 변경해야 했습니다.

  • Cursor: 일부 사용자가 며칠 만에 한 달치 크레딧을 소진
  • Replit: ‘난이도 기반 과금’ 도입 → Reddit 등에서 불만 폭주

그럼에도 불구하고, 일부 기업은 단기 손실을 감수하며 고객 기반 확대에 집중하고 있습니다. 벤처캐피털 Andreessen Horowitz의 마틴 카사도는 “결국 시장은 통합될 것이고, 지금은 점유율을 확보하는 시기”라고 진단합니다.

 

AI 비용 구조의 변화는 스타트업뿐 아니라 기존 소프트웨어 기업의 수익성에 직격탄을 날리고 있습니다. SaaS(서비스형 소프트웨어) 업계는 오랫동안 높은 마진 구조를 자랑해왔습니다. 서버 비용과 유지비를 감안해도 보통 70~90%의 영업 마진을 유지할 수 있었기 때문입니다. 하지만 최근 AI 도입 이후, 이러한 수익성의 공식이 흔들리고 있습니다.

 

대표적인 사례가 생산성 툴 **노션(Notion)**입니다. 불과 2년 전까지만 해도 노션의 마진은 90% 수준이었지만, AI 기반 기능을 대거 도입하면서 약 10%포인트가 AI 모델 제공업체로 유출되고 있습니다. 이는 단순한 비용 상승이 아니라, 사업 구조 자체가 플랫폼 종속형으로 변해간다는 신호입니다. 즉, SaaS 기업들이 자체 기술로 가치를 창출하기보다는, AI 모델 제공업체(OpenAI, Anthropic 등)에 이익을 분담해야 하는 구조로 바뀌고 있다는 의미입니다.

 

코드 자동화 분야의 스타트업 상황은 더욱 심각합니다.

  • Cursor: 사용자들이 며칠 만에 월간 크레딧을 모두 소진하면서 불만이 폭주, 가격 체계 개편 불가피
  • Replit: ‘노력 기반 과금(Effort-based pricing)’ 도입으로 복잡한 요청에는 더 많은 비용을 부과 → 커뮤니티(Reddit)에서 거센 반발

이처럼 고객 불만이 높아지면 이탈(churn) 위험도 커지는데, 이는 곧 성장세 둔화와 수익성 악화로 직결됩니다. 다만 Replit 사례처럼 단기적으로는 이탈률이 크지 않더라도, 장기적으로는 고객 신뢰를 잃을 수 있다는 점에서 리스크는 여전히 존재합니다.

문제의 핵심은 마진 압박의 불균형입니다.

  • 빅테크 기업: 자체 인프라와 모델을 갖추고 있어 AI 비용을 내부적으로 상쇄 가능 → 여전히 80~90% 마진 유지 가능
  • 스타트업·중소기업: 외부 모델에 의존 → 고객 확보와 마진 방어 사이에서 이중 압박

결국, 이 구조는 AI 산업 내 양극화를 심화시킵니다. 자본과 기술을 동시에 보유한 빅테크는 고객 기반을 잠식하면서도 버틸 수 있지만, 스타트업은 가격 인상으로 고객을 잃거나 마진 축소로 생존 위협을 받게 되는 것입니다.

 

 


⚖️ 빅테크 vs 스타트업 – 경쟁 구도

OpenAI, 구글, 메타 같은 거대 기업들은 연간 1,000억 달러 이상을 AI 인프라에 투자하며 자금을 태우고 있습니다. 이들은 다른 사업에서 나온 막대한 이익을 AI에 재투자할 수 있어, 사실상 스타트업과는 출발선부터 다른 게임을 하고 있습니다.

 

실제로 구글은 자사 코드 작성 툴을 아예 무료로 배포하며 스타트업 고객을 잠식하기 시작했습니다. 이처럼 AI 공급자(빅테크)가 동시에 고객과 경쟁자가 되는 구조는 스타트업 생태계에 큰 위협입니다.

 

AI 산업은 지금 극단적인 불균형 경쟁 구도로 빠르게 재편되고 있습니다. 핵심은 AI 인프라와 모델을 직접 보유한 빅테크와, 이를 임대하거나 API 형태로 빌려 써야 하는 스타트업·중소기업의 구조적 차이에 있습니다.

 

우선 빅테크 기업들—OpenAI, 구글, 메타, 아마존, 마이크로소프트—은 연간 1,000억 달러 이상을 AI 연구개발과 데이터센터 인프라에 쏟아붓고 있습니다. 이들은 막대한 현금흐름과 기존 사업(검색, 광고, 클라우드, 소셜 플랫폼 등)에서 나오는 이익을 AI에 재투자할 수 있습니다. 따라서 고객 확보를 위해 단기적으로 손해를 보더라도 버틸 수 있는 체력을 갖추고 있습니다. 실제로 구글은 최근 개발자를 대상으로 코드 작성 툴을 무료 배포하며 스타트업 고객을 직접 흡수하는 전략을 구사하고 있습니다.

 

반면 스타트업의 상황은 전혀 다릅니다. Cursor, Replit 같은 AI 코드 지원 스타트업이나 AI 기반 SaaS 기업은 대부분 외부 AI 모델을 API로 구매해야 합니다. 즉, 매출이 늘어날수록 API 비용도 함께 증가하는 구조적 한계를 안고 있습니다. 게다가 빅테크가 자사 제품과 서비스를 통해 직접적으로 고객을 잠식하기 때문에, 스타트업은 이중의 압박을 받게 됩니다.

 

이러한 구조는 **‘플랫폼-의존형 경쟁’**을 만들어냅니다. 빅테크는 플랫폼을 소유하고, 스타트업은 그 위에서 서비스만 제공하기 때문에 가격 결정권, 원가 경쟁력, 고객 데이터 활용 능력에서 모두 열세에 놓입니다. 장기적으로는 스타트업이 차별화된 틈새시장을 공략하거나, 특정 산업에 특화된 버티컬 AI를 개발하지 않는 한, 단순 소비자용 범용 AI 시장에서 버티기 어려운 환경이 될 수 있습니다.

 

결국 경쟁 구도의 본질은 **“AI를 직접 만든 자 vs AI를 빌려 쓰는 자”**의 대결입니다. 전자는 공격적으로 시장을 확장하면서 가격을 흔들 수 있고, 후자는 생존을 위해 끊임없이 비즈니스 모델을 조정해야 합니다. 이 격차는 시간이 갈수록 더 커질 가능성이 높습니다.

 

 


🧩 해법 – ‘덜 똑똑한 AI’의 활용

T3 Chat의 테오 브라운은 “대부분의 사용자는 사실 최첨단 모델이 필요하지 않다”며 더 저렴한 경량 모델 사용을 유도하고 있습니다.

예시:

  • GPT-5 Nano: 백만 토큰당 약 $0.10
  • GPT-5 Full: 백만 토큰당 약 $3.44

30배 이상 가격 차이가 존재하는 만큼, 소비자가 적절히 모델을 선택할 수 있도록 유도하는 것이 비용 부담을 줄이는 하나의 방법입니다. 그러나 이는 결국 ‘서비스 질의 희생’과 연결될 수 있어 딜레마로 남습니다.

 

AI 비용 문제를 해결하기 위한 가장 현실적인 해법 중 하나는 ‘덜 똑똑한 AI’를 적재적소에 활용하는 것입니다. 최신 대규모 모델(예: GPT-5 Full)처럼 고도화된 AI는 놀라운 성능을 보여주지만, 모든 상황에서 그것이 필요한 것은 아닙니다. 대부분의 사용자들이 원하는 것은 빠르고, 저렴하며, ‘충분히 괜찮은’ 결과이기 때문입니다.

 

예를 들어, 간단한 문서 요약, 이메일 작성, 기본 Q&A 같은 작업에는 초거대 모델이 굳이 필요하지 않습니다. 이럴 경우 경량화된 모델(GPT-5 Nano 등)을 사용하면 비용을 획기적으로 줄일 수 있습니다. 실제로 가격 차이는 극명합니다.

  • GPT-5 Nano: 100만 토큰당 약 $0.10
  • GPT-5 Full: 100만 토큰당 약 $3.44

무려 30배 이상의 비용 차이가 발생합니다.

스타트업 입장에서는 이런 모델을 서비스 구조에 전략적으로 배치하는 것이 생존 전략이 될 수 있습니다. 예를 들어,

  • 기본적인 요청 → 저비용 모델 자동 할당
  • 고난이도 문제(복잡한 코드 작성, 법률 분석 등) → 프리미엄 모델 옵션 제공

이런 방식으로 고객에게 선택지를 주면, 불필요하게 비싼 모델을 돌려 생기는 손실을 최소화할 수 있습니다.

또한, 사용자 경험을 해치지 않는 선에서 **‘모델 하이브리드 전략’**을 활용하는 것도 방법입니다. 먼저 저가 모델이 1차 답변을 생성하고, 필요할 때만 고급 모델이 보정하거나 추가 검증을 하는 방식입니다. 이를 통해 응답 품질은 유지하면서도 비용을 크게 절감할 수 있습니다.

 

궁극적으로 ‘덜 똑똑한 AI’의 활용은 단순한 원가 절감을 넘어, AI 소비 행태의 재편을 의미합니다. 사용자는 무조건 가장 똑똑한 AI를 쓰기보다는, **“내가 원하는 작업에 맞는 적정 수준의 AI”**를 선택하는 방향으로 이동하게 될 가능성이 큽니다. 이는 전력 사용에서 고사양 서버를 무조건 돌리지 않고, 상황에 따라 저전력 장치를 활용하는 것과 유사한 발상입니다.

 

 


🔍 딥다이브 – 이번 사안의 3가지 함의

  1. AI 산업의 역설 – 더 똑똑해질수록 ‘효율성’은 개선되지만, 비용 구조는 비효율적으로 변하고 있음.
  2. 스타트업의 생존 위기 – 가격 구조 불안정, 빅테크의 직접 경쟁, 마진 압박으로 도태 위험 확대.
  3. 소비자 선택의 갈림길 – 값비싼 최첨단 AI와 ‘적당히 쓸 만한’ 저가형 AI 사이에서 사용자 행동이 갈릴 가능성.

AI 비용 역설은 단순히 기업들의 재무 문제를 넘어, 산업 구조와 기술 발전 방향에 깊은 영향을 미칩니다. 이번 현상을 통해 짚어볼 수 있는 핵심 함의는 크게 세 가지입니다.

 

1️⃣ AI 산업의 역설 – 똑똑해질수록 ‘비효율적 비용 구조’

AI는 더 똑똑해지고 있지만, 그 대가로 토큰 사용량이 기하급수적으로 증가하고 있습니다. 즉, 단가 하락이 곧바로 비용 절감으로 이어지지 않는 구조적 모순이 생긴 것입니다. 이는 과거 클라우드 산업의 ‘규모의 경제’와는 정반대 흐름으로, 사용량이 늘어날수록 총비용이 올라가는 비선형적 비용 구조를 만들어냅니다. 기술 발전이 반드시 경제적 효율성을 담보하지 않는다는 점에서, AI 산업은 새로운 성장 한계에 직면하고 있습니다.

2️⃣ 스타트업 생존 위기 – 마진 압박과 플랫폼 종속

스타트업과 중소기업에게 이번 현상은 생존 그 자체의 문제입니다. 고객 확보 경쟁 때문에 함부로 가격을 올리기도 어렵고, 그렇다고 비싼 모델을 계속 쓰자니 마진이 급격히 줄어듭니다. 게다가 AI 인프라를 직접 보유한 빅테크가 자사 서비스(예: 구글의 무료 코드 툴)로 스타트업 고객을 잠식하면서, **‘플랫폼을 제공하는 자 vs 플랫폼에 의존하는 자’**의 격차는 더 벌어지고 있습니다. 이로 인해, 스타트업들은 점차 범용 시장에서 밀려나고, 특정 산업이나 고객군에 특화된 버티컬 AI(Vertical AI) 전략을 선택할 수밖에 없는 구조로 몰리고 있습니다.

3️⃣ 소비자와 시장의 재편 – ‘가성비 AI’의 부상

이번 현상은 소비자 행동에도 변화를 예고합니다. 모든 사람이 초거대 모델을 필요로 하는 것은 아니며, 많은 경우 **“충분히 괜찮은 AI”**가 더 합리적인 선택이 됩니다. 따라서 시장은 고성능·고비용 AI저비용·실속형 AI의 이원화 구조로 재편될 가능성이 큽니다. 이는 곧 “AI는 다 같은 AI가 아니다”라는 인식을 확산시키며, 사용자가 상황에 맞게 모델을 선택하는 시대를 열 것입니다. 기업 입장에서는 고객이 어떤 상황에서 어떤 모델을 선호하는지 데이터 기반으로 이해하고, 이를 바탕으로 차별화된 서비스 설계를 해야 생존할 수 있습니다.

 

👉 종합하면, 이번 사안은 AI 산업의 경제적 지속 가능성, 스타트업의 전략적 선택, 소비자 행동의 변화라는 세 가지 축을 동시에 드러내고 있습니다. 단순한 가격 논쟁을 넘어, AI 산업의 미래 질서를 좌우할 분기점이 될 가능성이 큽니다.

 

 

 

 


🚀 결론 – AI 붐, 어디까지 갈까?

AI 산업은 지금 **‘비용의 모순’**에 직면해 있습니다. 단가가 내려가는데 총비용은 오히려 올라가는 현상은 기업 수익성과 사용자 경험 모두에 타격을 주고 있습니다. 빅테크는 자본력으로 이를 견딜 수 있지만, 스타트업에게는 생존을 건 시험대가 될 수밖에 없습니다.

 

결국 AI 시장은 고도화된 모델과 경량화된 모델의 이원화로 흘러갈 가능성이 큽니다. 소비자들은 자신의 목적에 맞춰 ‘얼마나 똑똑한 AI’를 쓸지 선택해야 하며, 기업들은 효율적 토큰 사용 전략을 찾아내야 할 것입니다.

AI 붐은 당분간 지속되겠지만, 누가 승자가 될지는 비용을 얼마나 현명하게 관리하느냐에 달려 있습니다.

 

 

AI의 비용 역설은 단순한 가격 변동을 넘어, 산업 전체의 권력 구조와 전략 방향을 재편하고 있습니다. 빅테크 기업들은 자본과 인프라를 무기로 고객 확보를 위해 손실을 감수할 수 있는 여유를 지니고 있습니다. 반면 스타트업들은 외부 모델 의존과 마진 압박 속에서 차별화된 틈새시장을 찾거나, 효율적인 토큰 활용 전략을 개발하지 않으면 생존이 위태로울 수 있습니다.

 

소비자 측면에서는 ‘가성비 AI’와 ‘프리미엄 AI’의 양극화가 뚜렷해질 것입니다. 일부 전문 영역에서는 여전히 초거대 모델이 필요하겠지만, 대다수 일상적인 활용은 저렴하고 단순한 모델로 충분히 대체될 가능성이 큽니다. 따라서 기업들은 고객이 어떤 상황에서 어떤 모델을 선호하는지 이해하고, 이를 기반으로 모델 믹스 전략을 세워야 합니다.

 

궁극적으로 AI 산업의 미래는 **“비용을 얼마나 현명하게 관리하느냐”**에 달려 있습니다. 단순히 더 똑똑한 모델을 만드는 경쟁에서 벗어나, 경제적 효율성과 실제 활용성을 동시에 달성하는 기업이 진정한 승자가 될 것입니다. 지금의 비용 구조 논쟁은 그 승자를 가르는 첫 번째 시험대라 할 수 있습니다.

 

 

 

 

 

728x90