코코링크 클라이맥스210S, 인공지능 등 활용...94~240테라플롭스 실현
[글로벌이코노믹 이재구 기자] 칩셋보드 20층 적층 실현 및 이에따른 세계 최고속 컴퓨팅 성능을 갖는 고성능컴퓨터(HPC)가 국내기술로 개발·상품화됐다. 이 제품은 공학계산용이나 인공지능(AI) 딥러닝용에 주로 사용된다. 성능을 높이기 위해 칩셋(GPU) 20개를 별도 처리없이 그대로 랙에 꽂아 써도 발열문제가 없도록 설계됐다. 지금까지는 별도처리를 통해 20층 적층을 실현했다. 서울대 기술지주회사 자회사인 코코링크(대표 이동학)는 지난달 29일 서울대에서 열린 인지과 학산업협회 튜토리얼 행사장에서 세계 최고 칩셋 기판(보드) 집적도를 갖는 HPC(모델명 클라이맥스-210S)를 개발했다고 공식 발표했다. 일반적으로 단일 시스템(HPC)에 더 많은 칩셋보드를 꽂을수록 성능은 높아지지만 발열 문제가 발생해 성능을 높이기 쉽지 않다.
HPC의 대당 성능은 적용하는 칩셋에 따라 94~240테라플롭스(1테라플롭스=초당 1조회 부동소수점 연산처리)를 구현해 세계최고 처리 속도를 자랑한다. 제품 가격은 꽂히는 칩셋 스펙에 따라 3000만원에서 1억8000만원에 이른다. 이 HPC를 여러 대 병렬로 구성하면 슈퍼컴퓨터가 된다.
이 고성능컴퓨터(HPC) 한 대에는 PCI익스프레스버스(PCIe)에 꽂히는 모든 장치 20개가 꽂힌다. 즉 GPU·솔리드스테이트드라이브(SSD)·네트워크 인터페이스 카드·FPGA연산 가속장치 같은 것을 20개나 꽂을 수 있다.
이 HPC에 20개의 엔비디아 테슬라 P100 GPU를 꽂으면 94테라플롭스(TF)성능(싱글 프리시전 기준)이 나온다. 20개의 P40 엔비디아 GPU를 장착하면 240TF의 성능까지 구현할 수 있다.
클라이맥스-210S는 또한 기존 제품과 달리 시스템에 탑재된 모든 GPU나 SSD 간에 싱글루트보다 진전된 싱글블록의 P2P 데이터 전송을 지원한다.
이동학 코코링크 사장은 “HPC설계시 칩셋기판 적층의 최대 난제로 꼽혀 온 냉각 안정성을 확보하면서 기술적 진전을 이룰 수 있었다. 이미 프랑스 오렌지텔레콤 실리콘밸리연구소와 KAIST·대구경북과학기술원(DGIST)에 각각 한 대씩 공급했다”고 밝혔다.
클라이맥스-210S의 크기는 440 x 740 x 310mm다. 7U(310mm)높이의 19인치 표준랙에 장착할 수 있다.
이 시스템에는 8000W(2000Wx4)의 전원공급장치가 적용돼 안정적 전력공급을 확보하게 되면서 풀로드 연산에 대응할 수 있게 됐다. 12개의 120mm고성능 쿨링팬이 완벽하게 열을 방출한다. 모니터링 LED등이 달려 제품 내부에 장착된 파워, 네트워크 저장장치, 연산가속기의 상태와 성능을 손쉽게 파악할 수 있도록 했다.
이동학 사장은 “지난 3월 프랑스 최대 이통사 오렌지텔레콤의 공급협력사로 등록됐으며 하반기에는 이 회사에 직접 수출하는 의미있는 성과가 기대된다”고 말했다.
이재구 기자 jklee@g-enews.com