닫기

글로벌이코노믹

딥시크, 새로운 AI 추론 방법 공개로 차세대 모델 기대감 고조

글로벌이코노믹

딥시크, 새로운 AI 추론 방법 공개로 차세대 모델 기대감 고조

칭화대와 협력해 인간 선호에 맞는 '제너레이티브 보상 모델링' 기술 개발
추론 능력 향상한 R2 모델 이달 출시 가능성... "경쟁력 있는 성능 달성"
딥시크 표출 장면. 사진=로이터이미지 확대보기
딥시크 표출 장면. 사진=로이터
중국의 인공지능 스타트업 딥시크(DeepSeek)가 차세대 모델 출시를 앞두고 대규모 언어 모델(LLM)의 추론 능력을 개선하기 위한 새로운 접근법을 발표했다고 6일(현지시각) 홍콩에서 발행되는 사우스차이나모닝포스트(SCMP)가 보도했다.

최근 공개된 논문에 따르면, 딥시크는 칭화대학교 연구진과 협력해 '제너레이티브 보상 모델링(GRM)'과 '자기 원칙적 비평 튜닝(self-principled critique tuning)'이라는 방법을 결합한 기술을 개발했다. 이 이중 접근법은 LLM이 일반 쿼리에 더 빠르고 향상된 결과를 제공할 수 있도록 설계됐다.

연구진은 개발된 'DeepSeek-GRM' 모델이 강력한 공개 보상 모델로서 "경쟁력 있는 성능을 달성"하며 기존 방법을 능가했다고 밝혔다. 보상 모델링은 LLM을 인간의 선호도에 맞게 안내하는 프로세스다. 연구원들에 따르면 딥시크는 이 GRM 모델을 오픈소스로 공개할 의도가 있지만, 구체적인 일정은 제시하지 않았다.

온라인 과학 논문 저장소인 arXiv에 게재된 이 학술 논문은 회사의 V3 파운데이션 모델과 R1 추론 모델로 전 세계적인 관심을 받은 후 발표됐다. 로이터 통신은 지난달 R1의 후속 제품인 '딥시크-R2'가 빠르면 4월 중 출시될 수 있다고 보도한 바 있다.
딥시크-R1의 출시는 주요 모델에 필적하는 비용 효율적인 성능으로 글로벌 기술 커뮤니티에 큰 파장을 일으켰다. 그러나 딥시크는 R2 출시 소문에 대해 공식적인 입장을 밝히지 않고 있다. 중국 언론에 따르면 한 고객 서비스 계정이 기업 고객과의 그룹 채팅에서 이 보도를 부인했다고 전해졌다.

기업가 량원펑(Liang Wenfeng)이 2023년 설립한 항저우 기반 딥시크는 최근 몇 달간 전 세계의 주목을 받았으나, 공개적인 소통보다는 연구 개발에 역량을 집중하는 스타일을 보여왔다.

딥시크는 지난달 'DeepSeek-V3-0324'라는 V3 모델 업그레이드 버전을 공개하며 "향상된 추론 능력, 최적화된 프론트엔드 웹 개발, 업그레이드된 중국어 작문 능력"을 갖추었다고 밝혔다. 또한 2월에는 5개의 코드 저장소를 오픈소스로 공개해 개발자들이 소프트웨어 개발을 검토하고 기여할 수 있도록 했다. 이 스타트업은 "완전한 투명성을 바탕으로 진지한 진전"을 이루겠다고 약속했다.

같은 달, 량원펑은 대량의 데이터 처리 시 LLM의 효율성을 개선하는 방법인 "네이티브 희소 주의(native sparse attention)"에 관한 기술 연구도 발표했다.

40세인 량원펑은 딥시크의 모회사인 하이플라이어 퀀트(High-Flyer Quant)의 설립자이기도 하다. 이 헤지펀드는 딥시크의 기술 발전을 위해 상당한 자금을 지원해왔다.

지난 2월 말, 량원펑은 시진핑 중국 국가주석이 베이징에서 주최한 기술 기업가 심포지엄에 참석했다. 딥시크는 중국의 인공지능 발전을 억제하려는 미국의 제재 속에서 중국의 기술적 회복력을 보여주는 상징으로 주목받고 있다.

최근 딥시크의 행보는 중국이 미국과의 기술 경쟁, 특히 AI 분야에서 독자적인 발전을 이루고자 하는 노력의 일환으로 평가받고 있다. 오픈소스 전략과 학술적 연구 공유를 통해 딥시크는 글로벌 AI 커뮤니티에서 영향력을 확대하고 있다.


신민철 글로벌이코노믹 기자 shincm@g-enews.com