[초점] 기밀 데이터 공유 없이 '신약 개발' AI 개발…다케다와 에자이, '연합 학습' 활용

AI(인공 지능) 문자가 컴퓨터 마더보드에 배치되어 있는 모습. 사진=로이터

인공지능(AI) 기술의 발전은 의료 분야에도 새로운 가능성을 열고 있다. 특히 신약 개발 과정에서 AI는 후보 물질의 효능 및 안전성을 평가하는 데 중요한 역할을 하며, 기업들은 경쟁력 확보를 위해 AI 기술 개발에 힘쓰고 있다. 그러나 신약 개발 과정에서 발생하는 방대한 양의 데이터는 기밀성이 높아, 기업 간 데이터 공유가 어려운 문제점이 존재했다.

이러한 문제점을 해결하기 위해 일본의 다케다와 에자이 등 제약사들은 '연합 학습'이라는 새로운 방식을 도입했다고 일본경제신문 니혼게이자이가 29일(현지시간) 보도했다. 연합 학습은 각 기업이 보유한 데이터를 직접 공유하지 않고 서로 협력하여 AI 모델을 학습시키는 기술이다. 이는 기밀 정보 보호를 유지하면서도 다양한 데이터를 활용하여 AI 모델의 성능을 향상시킬 수 있다는 장점을 가지고 있다.

연합 학습의 장점과 활용 분야

연합 학습은 신약 개발 분야뿐만 아니라 금융, 제조, 소매 등 다양한 분야에서 활용될 수 있다. 예를 들어, 금융 분야에서는 은행들이 연합 학습을 통해 부정 거래를 탐지하는 AI 모델을 공동 개발할 수 있으며, 제조 분야에서는 제조 공정의 효율성을 높이는 AI 모델을 개발할 수 있다. 또한, 소매 분야에서는 소비자들의 구매 패턴을 분석하여 맞춤형 마케팅 전략을 수립하는 데 활용할 수 있다.

연합학습의 흐름은 크게 3단계로 나뉜다. 먼저 중앙 서버에서 학습 전의 빈 상태의 AI 모델을 각 기업의 로컬 서버에 배포한다. 다음 단계에서는 각 기업이 각자 보유한 데이터로 AI를 학습시키고, 원래 모델과의 차이를 중앙 서버로 돌려보낸다. 3단계에서 중앙 서버는 각 기업으로부터 받은 데이터를 취합해 AI의 모델을 업데이트한다.

중앙 서버는 업데이트된 AI 모델을 다시 각 기업의 로컬 서버에 배포하고, 새로운 데이터로 학습을 이어간다. 이 작업을 반복함으로써 AI의 성능을 단계적으로 향상시킬 수 있다. 로컬 서버에서 중앙 서버로 전송된 데이터에서 개별 기업의 학습 내용을 복원하는 것은 '거의 불가능'하기 때문에 각 기업의 정보 기밀성은 유지된다.

연합 학습은 이처럼 데이터 공유의 장벽을 허물고 기업 간 협력을 촉진하여 다양한 분야에서 혁신을 가져올 것으로 기대된다. 특히, 기밀 정보 보호가 중요한 분야에서 더욱 효과적으로 활용될 수 있으며, 향후 더욱 다양한 분야에서 연합 학습 기술의 적용 범위가 확대될 것으로 전망된다.

실제 적용 사례

다케다와 에자이는 연합 학습을 활용하여 화합물과 단백질의 결합을 예측하는 AI 모델을 공동 개발했다. 이는 기존 방식보다 높은 정확도를 달성하며, 신약 개발 과정을 효율적으로 진행할 수 있는 가능성을 보여주었다.

연합 학습은 기업들이 경쟁력을 유지하면서도 협력을 통해 AI 기술을 발전시킬 수 있는 혁신적인 방식이다. 앞으로 연합 학습 기술의 발전과 더불어 다양한 분야에서 긍정적인 변화를 가져올 것으로 기대된다.

노정용 글로벌이코노믹 기자 noja@g-enews.com