지난달 28일(현지 시간) 중국 기술 매체 IC스마트는 AI 스타트업 인텔리퓨전(Intellifusion)이 기존 AI칩 대비 저렴한 비용으로 생성형 AI의 필수 요소인 대규모언어모델(LLM)을 개발할 수 있는 ‘딥 아이즈(Deep Eyes)’ AI 가속기를 공개했다고 보도했다.
성능만 보면 엔비디아의 전 세대 AI 칩 ‘A100’의 int8 훈련 성능인 624TOPS와 비교해 13분의 1에 불과하다. 하지만 A100칩 가격이 개당 1만 달러(약 1300만원) 선으로 알려진 것을 고려하면 딥 아이즈 AI 가속기는 13개 가격인 1만3000위안(약 241만원)으로 비슷한 성능을 구현할 수 있다.
딥 아이즈의 핵심인 ‘딥에지 10맥스 SoC’ 칩은 오픈소스 기반 개방형 명령어 ‘RISC-V’를 채택했으며, 첨단 미세공정보다 몇 세대 전인 14나노미터(㎚·10억분의 1m) 공정으로 제조된다. 이는 중국의 현재 반도체 기술로도 대량 양산이 가능함과 동시에, 미국의 각종 규제와 상관없이 자체 AI 역량을 강화할 수 있음을 의미한다.
영국의 반도체 개발사 ARM의 중국 지사지만, 실질적으로는 중국 기업이며 독자 노선을 걷고 있는 ARM 차이나도 최근 AI 연산을 가속하는 자체 개발 신경망처리장치(NPU)인 ‘저우이(Zhouyi)’를 공개했다.
ARM 차이나는 저우이 NPU를 중국산 중앙처리장치(CPU)와 통합하고, 리눅스용 오픈소스 드라이버를 제공해 가격 대비 성능이 우수한 AI 가속기를 선보인다는 계획이다. 인텔리퓨전의 딥 아이즈와 마찬가지로 단일 제품 기준으로는 고성능이 아니지만, 중국 내에서 쉽게 양산이 가능하고, 미국의 규제에 상관없이 개발자들이 쉽게 접근할 수 있다는 점 등에서 공통분모를 가지고 있다.
미국의 반도체 규제가 강화된 이후 중국은 최신 AI칩 확보가 어려워지면서 AI 기술 격차가 갈수록 벌어지고 있는 중이다. 미국산 AI칩(주로 엔비디아)에 대한 의존도가 너무 높았던데다, 이전까지 자체 개발했던 AI칩들도 중국의 자체 반도체 기술로는 양산이 어려워 충분한 대안이 되지 못했기 때문이다.
하지만 인텔리퓨전이나 ARM 차이나가 선보인 AI 가속기들의 경우 중국 자체 기술로도 충분히 개발 및 양산할 수 있고, 가격 대비 효율도 우수한 주문형반도체(ASIC) 방식 AI 가속기로서 새로운 활로를 개척하고 있다.
중국은 앞서 비트코인 등 암호화폐 채굴 열풍이 한창이던 시기에도 GPU 기반 채굴기의 한계가 명확해지자 비용 대비 효율이 더 뛰어난 ASIC 채굴기를 일찍 개발해 도입한 바 있다. 이후 GPU 기반 채굴기가 완전히 몰락한 현재, AISC 방식 채굴 장비는 전 세계 채굴 산업의 표준으로 자리매김했다.
현재 마이크로소프트(MS), 구글, 아마존, 메타 등 AI 산업을 선도하고 있는 미국의 빅테크 기업들도 비용 대비 효율 등을 이유로 GPU 기반 AI칩 의존도를 낮추고 장기적으로는 ASIC 기반 자체 AI칩으로 전환하기 위해 노력하고 있지만, 당장은 쉽지 않은 상황이다.
오히려 강제적으로 AI 산업에서 탈GPU를 하게 된 중국은 자체 AI칩 개발을 통해 향후 AI 산업에서 미국이나 서방 국가들과 분리된 독자적인 노선을 한발 빨리 타고 새로운 시장을 형성할 것으로 보인다.
최용석 글로벌이코노믹 기자 rpch@g-enews.com