기술 기업들의 'AI 전쟁' 중 영상 생성형 AI가 주요 전장으로 떠올랐다. '챗GPT'로 유명한 오픈AI가 앞서가는 곳으로 평가 받는 가운데 미국과 중국에서 연달아 유사 서비스로 추격에 나섰다.
중국의 바이트댄스는 최근 자체 거대 언어 모델(LLM) 기반 챗봇 '두바오(豆包)'에 텍스트·이미지를 기반으로 영상을 생성하는 기능을 추가했다. 현재 일부 얼리어답터 그룹을 상대로 테스트하고 있으며 곧 대중에 해당 기능을 공개한다는 방침이다.
두바오는 현재 중국에서 가장 보편적으로 쓰이는 AI 챗봇이다. 바이트댄스는 두바오 외에도 영상 편집 서비스 '캡컷' 또한 보유하고 있어 동영상 생성 AI와 시너지를 낼 수 있을 전망이다.
틱톡의 라이벌로 꼽히는 콰이쇼우 올 6월 이미지 생성 AI '커링(可靈, 영문명 KOLORS)'에 숏폼 영상 생성 기능을 추가했다. 콰이쇼우는 최근 커링의 이용자가 360만명을 돌파했으며 4개월 동안 약 3700만개 동영상을 생성했다고 밝혔다.
AI 기슬에 특화된 곳으로 평가 받는 지푸(智譜) 역시 올 7월 영상 생성 AI '잉(影)'을 선보였다. 당시에는 약 30초 안에 6초 길이 숏폼 영상을 선보이는 기능을 지원했는데, 최근 업데이트로 4K 수준의 고화질 영상을 10초 길이로 생성할 수 있는 수준으로 업데이트했다. 지푸는 이 외에도 영상 편집 AI '코그비디오' 시리즈 등도 지속 개발, 공개하고 있다.
중국 기술 기업들이 선보인 영상 생성형 AI들에 대해 현지 외신은 공통적으로 '소라의 대항마'라는 명칭을 붙인다. 소라는 오픈AI가 올 2월 15일 공개한 텍스트 투 비디오(TTV) AI 모델로, 텍스트 프롬프트 입력 만으로 약 1분 길이 영상을 생성할 수 있다.
미국 빅테크 역시 앞다퉈 영상 생성 AI들을 내놓고 있다. 메타는 지난달 4일 영상 생성 AI '무비젠'을 공개했다. 1080p(픽셀) 해상도 영상을 최대 16초 길이로 생성할 수 있으며 배경, 객체 등을 손쉽게 제거하는 '스마트 편집' 기능도 제공한다. 메타는 이 AI를 오픈 소스 형태로 공개하는 대신 인스타그램 등 기존 SNS 환경과 연계할 수 있도록 소비자들에게 제공할 방침이다.
구글은 올 5월 딥마인드 연구진이 개발한 영상 생성형 AI '비오(Veo)'를 공개했다. 60초 길이 영상을 생성할 수 있는 모델로, 향후 유튜브에 비오 기반 쇼츠 제작 서비스를 도입한다는 방침이다.
영상 생성형 AI는 광고 마케팅과 영상 콘텐츠 시장 양쪽에서 높은 가치를 가진 기술로 평가 받는다. 자연히 빅테크들이 선보인 영상 생성형 AI 중 기술력, 접근성 면에서 뛰어난 모델들이 중점적으로 부가가치를 창출할 가능성이 높다.
미국 시장 조사 업체 그랜드뷰리서치는 미디어·엔터테인먼트 시장에서 생성형 AI가 2023년 기준 197억5000만달러(약 27조원)의 시장 가치를 갖고 있다고 평했다. 아울러 시장 규모가 7년에 걸쳐 매년 26% 성장, 2030년에는 994억8000만달러(약 139조원)에 이를 것으로 전망했다.
이원용 글로벌이코노믹 기자 wony92kr@naver.com