글로벌 테크 기업들이 그래픽처리장치(GPU)를 대규모로 집적한 AI 슈퍼컴퓨팅 구축 경쟁에 뛰어들면서, 기술 패권의 새로운 분수령을 맞고 있다.
월스트리트저널(WSJ)은 23일(현지 시각) 이러한 경쟁이 반도체 산업 지형도에 근본적 변화를 가져올 것이라고 분석했다.
WSJ 보도에 따르면, 머스크의 엑스AI는 멤피스에 엔비디아 호퍼 GPU 10만 개를 탑재한 '콜로서스' 슈퍼컴퓨터를 구축했다. 이는 챗GPT 초기 버전 학습(1만 개)의 10배 규모다. 머스크는 내년 여름까지 차세대 블랙웰 GPU 30만 개 규모의 클러스터 구축을 목표로 제시했다. 메타의 저커버그 CEO도 "업계 최대 규모"의 클러스터로 고도화된 AI 모델을 훈련 중이라고 밝혔다.
현재 AI 반도체 시장의 80% 이상을 장악한 엔비디아는 AI 수요 급증에 대응해 차세대 GPU '블랙웰'을 2025년 초 출시할 예정이다. 호퍼 대비 2~3배 성능이 향상될 것으로 기대되는 블랙웰은, 대규모 언어 모델 학습 시간을 획기적으로 단축할 수 있을 것으로 전망된다. 업계에서는 이미 주요 AI 기업들이 블랙웰 기반 슈퍼컴퓨터 구축을 위해 300억 달러 이상의 선주문을 진행한 것으로 추정하고 있다.
다만, 이러한 폭발적 수요 증가가 실제 구축으로 이어질지는 불확실하다. 칩당 3만 달러로 예상되는 가격과 막대한 부대비용이 큰 걸림돌로 작용할 수 있기 때문이다. 세미애널리시스의 수석 애널리스트는 "현재 기술로는 10만 개까지의 확장성만 입증됐을 뿐, 그 이상의 규모는 기술적·경제적 타당성이 검증되지 않았다"고 지적했다. 특히 대규모 클러스터 운영에 따른 추가 비용과 기술적 복잡성이 기업들의 투자 결정에 중요한 변수가 될 것으로 예상된다.
기술적 과제도 산적해 있다. 메타는 1.6만 개 규모 클러스터 운영 중 잦은 하드웨어 고장을 경험했다고 보고했다. 10만 개 규모 클러스터의 전력 소비량은 중소도시 수준에 달할 것으로 예측되며, 액체 냉각 시스템 구축에만 수억 달러가 더 소요될 전망이다. 펭귄 솔루션스의 CEO는 "복잡성 증가로 투자 효율이 50% 이하로 떨어질 수 있다"고 경고했다.
이러한 상황에서 글로벌 기업들의 자체 AI 칩 개발이 가속화되고 있다. 구글의 TPU(텐서처리장치), 아마존의 트레이니엄이 이미 실전 배치됐으며, 메타도 MTIA를 개발해 일부 워크로드에 적용 중이다. 특히 삼성전자는 NPU(신경망처리장치) 기술을, SK하이닉스는 PIM(메모리 내 연산) 기술을 통해 AI 반도체 시장 진입을 준비하고 있다.
주목할 점은 한국 기업들의 경쟁력이다. 현재 HBM(고대역폭메모리) 시장의 90% 이상을 점유하고 있어, AI 가속기 시장으로의 확장 가능성이 높다. 특히, 삼성전자는 3나노 공정 기술을 바탕으로 AI 특화 반도체 개발에 박차를 가하고 있다.
2025년 트럼프 재집권 시 미·중 기술 패권 경쟁은 더욱 심화될 전망이다. 중국 제재 강화로 엔비디아의 단기 독점이 강화되겠지만, 역설적으로 각국의 기술 자립 노력이 가속화될 것이다. 결과적으로 글로벌 AI 반도체 시장은 기술적 도전과 지정학적 변수가 맞물리며 새로운 국면을 맞이할 것으로 예상된다.
박정한 글로벌이코노믹 기자 park@g-enews.com