엔비디아, 음악·음성 생성하는 새로운 AI 모델 발표

20일 미국 텍사스주 오스틴에 있는 엔비디아 사무실 간판 사진=AFP/연합뉴스

미국 반도체 대기업 엔비디아가 25일(현지시각) 음악과 음성을 생성하는 새로운 인공지능(AI) 모델 '푸가토(Fugatto)'를 발표했다고 블룸버그 등 현지 외신이 보도했다.·

푸가토는 'FunDigital Generative Audio Transformer Opus 1'의 줄임말로, 목소리를 수정하거나 기발한 음성을 만들어낼 수 있는 기술이며 음악, 영화, 비디오 게임 제작자들이 사용할 수 있도록 하고 있다.

이에 따라 텍스트에서 음향 효과와 음악을 생성하는 한편, 개가 짖는 트럼펫 소리와 같은 기발한 소리도 만들어낼 수 있다.

엔비디아는 현재로써는 이 기술을 일반에 공개할 계획은 없다고 밝혔다.

이로써 엔비디아는 메타플랫폼스, 스타트업 런웨이 등 텍스트에서 음성과 영상을 생성할 수 있는 기술을 개발한 기업으로 이름을 올리게 됐다.

푸가토가 타사 기술과 다른 점은 엔비디아의 AI 기술에는 기존 음성을 가져와 수정할 수 있는 능력이 있다는 점이다. 피아노 연주를 사람의 목소리로 노래로 변환하거나, 녹음된 사람의 말에서 사용된 억양이나 표현된 분위기를 바꿀 수도 있다.

엔비디아 브라이언 카탄차로 부사장은 “어떤 생성 기술도 위험을 수반한다. 우리가 바람직하지 않다고 생각하는 것을 사람이 생성할 가능성이 있기 때문이다"라며 “우리는 이 기술에 대해 신중할 필요가 있다. 일반에 즉각 공개하지 않는 것은 그런 이유가 있기 때문"이라고 설명했다.

이용수 글로벌이코노믹 기자 piscrait@g-enews.com