Compute says no

제목: 컴퓨터가 안 된다고 한다
공급 부족이 AI의 경제 구조를 어떻게 재편할 것인가

인공지능(AI)은 공급 문제를 겪고 있다. 거대 언어 모델의 결과물을 산출하는 단위인 ‘토큰’을 전 세계가 게걸스럽게 소비하면서, 토큰이 부족해지는 상황에 이르렀다. AI 모델 마켓플레이스인 오픈라우터(OpenRouter)에 따르면 주간 토큰 소비량은 1월에서 3월 사이 4배로 증가했는데, 이는 부분적으로 코딩 도구의 사용이 늘어난 영향이다. 업계는 이를 따라잡지 못하고 있다.

모델 제작사와 거대 기술 기업들 사이에서는 배급제가 시행되고 있다. '클로드(Claude)' 개발사인 앤스로픽(Anthropic)은 최근 사용량이 몰리는 시간대에 과도한 사용을 억제하기 위해 이용 약관을 조정했다. 아마존은 "용량 제약"이 성장을 제한하고 있다고 밝힌 바 있다. 챗GPT(ChatGPT) 개발사인 오픈AI(OpenAI)의 최고재무책임자(CFO) 사라 프라이어는 회사가 충분한 처리 능력(또는 ‘컴퓨트’)을 확보하지 못해 모든 기회를 추구하고 있지는 않다고 말했다. 최근 이 회사는 비디오 생성 모델 프로젝트를 중단하기도 했다.

이러한 공급 부족 현상은 광범위한 결과를 초래할 수 있다. 컴퓨트 자원이 희소한 세상은 AI의 경제학을 형성하며, 수익 배분부터 AI 기술 도입에 대한 유인책까지 모든 것을 변화시킬 것이다.

AI 용량을 빠르게 늘리는 것은 어렵다. 특히 미국에서는 데이터 센터 신설에 대한 지역 사회의 반대로 건설이 지연되고 있다. 변압기, 배전반, 가스 터빈의 부족도 지연을 야기하며, 일부 장비는 도입하는 데 2~5년이 걸리기도 한다. 가장 심각한 병목 현상은 프로세서에서 발생한다. 세계에서 가장 가치가 높은 기업인 엔비디아(Nvidia)가 설계한 것과 같은 AI 칩은 여전히 구하기 어렵다. 이러한 압박은 메모리 칩과 중앙처리장치(CPU)를 포함한 다른 유형의 실리콘 부품으로도 확산되고 있다. 이러한 제약 중 조만간 완화될 것은 거의 없다. 공급망을 확장하는 데는 수년이 걸리며, 하드웨어 제조사들은 자신들에게 장비를 공급받는 하이퍼스케일러(초대형 데이터 센터 운영 기업)들보다 여전히 신중하게 투자하고 있다.

하드웨어 가격이 비쌀 때는 대차대조표의 규모가 그 어느 때보다 중요하다(비즈니스 섹션 참조). 공급망의 어느 부분을 보더라도, 필요한 하드웨어를 선점할 수 있는 재무적 능력과 협상력을 갖춘 기업은 극소수에 불과하다. 올해 아마존, 구글, 메타, 마이크로소프트, 오라클 등 5개 데이터 센터 하이퍼스케일러는 총 7,500억 달러 이상의 자본 지출을 단행할 예정이다. 오픈AI와 앤스로픽은 수천억 달러 규모의 파트너십과 투자를 발표했다. 엔비디아는 2026년과 2027년 일부에 필요한 메모리 대부분을 미리 확보한 것으로 알려졌으며, 공급망을 강화하기 위해 다양한 기술 기업에 투자도 단행했다.

가장 큰 수익은 병목 구간에서 발생한다. AI 붐은 특히 엔비디아와 가장 첨단 칩의 거의 전부를 생산하는 대만의 TSMC에 큰 혜택을 가져다주었다. 칩 제조사들의 가격 결정력은 그들이 만드는 트랜지스터의 미세함만큼이나 거대해졌다. 엔비디아의 매출 총이익률은 2019년 60%에서 약 75%로 상승했다. TSMC의 매출 총이익률은 60%를 넘어, 다른 많은 위탁 생산 업체보다 약 두 배 높다.

하드웨어 거인들은 특정 기업을 선호하지 않는다고 부정하지만, 누가 희소한 장비를 가져갈지에 대해 영향력을 행사하고 있다.
높은 가격으로 인해 소프트웨어 업체들은 자체적인 해결책을 모색하고 있다. 자체 설계 칩은 엔비디아 제품을 구매하는 것보다 비용이 절반가량 저렴할 수 있다. 하지만 설계 자체가 쉽지 않다. 이를 시도하는 소프트웨어 기업 중 구글만이 10년 넘는 노력 끝에 대규모 양산이 가능한 실질적인 대안을 만들어냈다. TSMC를 대체하는 것은 더욱 어렵다. 인텔과 삼성 등 다른 칩 제조사들도 최첨단 공정에서 TSMC의 수준을 맞추는 데 고전하고 있다. 스페이스X와 테슬라의 CEO인 일론 머스크는 TSMC에 맞설 ‘테라팹(Terafab)’ 건설 계획을 제시했으나, 예상 비용만 5조~13조 달러에 달하는 비현실적인 규모다.

공급 부족이 가져올 마지막 결과는 AI 기술 도입 속도의 둔화다. 지금까지 AI 붐은 쿼리에 대한 응답 비용이 계속 저렴해질 것이라는 낙관적인 가정에 기반해 왔다. 실제로도 그랬다. 지난 1년간 ‘추론’ 가격은 5~10배 하락했다. 인도와 같은 국가에서는 AI 기업들이 사용자를 유인하기 위해 초저가 구독 모델을 선보이고 있다. 그러나 이는 이러한 가격 하락을 유지하기 위해 기업들이 얼마나 많은 현금을 소진하고 있는지를 가리고 있을 뿐이다. 오픈AI와 앤스로픽은 향후 몇 년간 수십억 달러의 적자를 기록할 것으로 예상된다. 두 기업 모두 상장을 준비하면서, 언젠가 수익을 낼 수 있다는 점을 입증해야 한다는 압박을 느끼게 될 것이다.

보이지 않는 RAM
기술 분야 외의 영역까지 AI 활용도가 높아짐에 따라 AI 관련 가격은 상승할 것이다. AI가 경제를 변혁하려면 토큰에 대한 수요는 수십 배 이상 커져야 한다. 모델 제작사들이 상승하는 컴퓨트 비용을 전가함에 따라, 사용자들은 경제성을 고려해야 할 것이다. 오늘날 많은 기업이 특정 업무에 AI를 사용하는지 여부로 자신들의 수준을 평가한다. 그러나 앞으로는 인간 노동력을 대할 때와 마찬가지로, AI를 효율적으로 사용하고 있는지 질문해야 할 시기가 올 것이다.