올인원 커머스AI 구독서비스 '에이플러스 AI'를 운영하고 있는 버즈니가 다음 달 미국에서 열릴 세계 최고 권위 자연어처리 학회 'EMNLP 2024'에서 영상 검색 기술 관련 연구 논문을 발표할 예정이라고 26일 밝혔다.
11월 12~16일까지 미국 플로리다에서 진행될 EMNLP는 자연어처리 분야 글로벌 최고 AI 학회 중 하나로, 버즈니는 '대규모 언어 모델을 활용한 텍스트 비디오 검색 및 재정렬 파이프라인을 위한 반복적 피드백 학습 기반 다중 모달 임베딩 정제 기법'에 대한 연구를 발표할 예정이다.
이 연구는 멀티미디어 콘텐츠의 급속한 증가로 인해 대규모 영상 데이터에서 관련된 영상을 정확하게 검색하는 어려움에 주목했고, 이를 해결하기 위해 MERLIN (Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline)이라는 새로운 검색 시스템을 제안했다.
MERLIN은 대규모 언어 모델(LLM)을 활용해 반복적인 피드백 학습 과정을 거쳐 사용자의 검색어와 검색된 영상 간의 불일치를 해결하고, 검색 정확도를 크게 향상시킨다.
이 기술은 버즈니의 올인원 커머스AI 구독서비스 '에이플러스AI'에서 제공하고 있는 기술 중 하나인 '숏폼 AI'에 우선 적용해 성능을 높이는데 기여할 예정이다. '숏폼 AI'는 AI가 영상의 핵심을 추출해 1분 이하의 숏폼 콘텐츠를 자동 생성하는 기술이다. 버즈니는 이 기술을 CJ온스타일과 신세계라이브쇼핑 등에 제공하고 있다.
버즈니 남상협 대표는 "이번 성과는 지난 10년 넘는 기간 커머스AI 연구 개발에 적극 투자해 온 버즈니의 기술력이 세계 무대에서도 인정받은 것"이라며 "앞으로도 에이플러스AI 기술을 도입한 고객사의 업무 효율성 향상 및 매출 극대화를 위해 커머스AI 기술에 대한 연구·개발(R&D) 투자를 지속해 나갈 계획"이라고 말했다.