15일 관련 업계에 따르면 AI 무단 학습 방지를 위한 정부와 개인의 노력이 활발하게 이뤄지고 있다. 특히 미국의 경우 초당적 협치를 통해 상원의원 그룹이 언론인·예술가 등이 당사자 허락 없이 창작품을 AI에게 빼앗기지 않도록 보호하는 새로운 법안을 발의했다.
또한 일부 보안 연구 목적의 예외를 제외하고 창작 또는 저널리즘 콘텐츠용 AI 도구에 사용자가 출처에 대한 정보를 첨부해야 한다. 해당 정보를 변조하거나 삭제하는 것을 금지하며 이러한 콘텐츠는 AI 모델 학습에도 사용할 수 없는 것으로 알려졌다.
미국배우조합(SAG-AFTRA), 미국 레코딩 산업 협회, 뉴스·미디어 연합, 아티스트 권리 연합 등 많은 출판 및 아티스트 단체는 해당 법안의 도입을 지지하는 성명을 발표했다.
성명에서 "인공지능의 능력은 우리 회원들의 경제와 평판에 있어 실질적인 위협이 되고 있다. 우리는 사람의 기본 권리를 보호하기 위해, 생성형 인공지능과 콘텐츠에 있어 완전히 투명하고 책임감 있는 공급망이 이뤄져야 한다"고 주장했다.
AI 무단 학습을 방지하기 위한 개인 창작자들의 움직임도 분주하다. 자신이 그린 그림에 AI 학습을 어렵게 만드는 일종의 '가공 처리'를 하거나 역으로 AI 학습 데이터를 오염시키고 있는 것.
기존의 AI 학습 방어 도구인 '글레이즈(Glaze)'는 이미지에 노이즈(변형)를 입혀 생성형 AI가 창작자의 그림을 학습할 수 없도록 만든다. 저작권 방어 도구 '나이트쉐이드(Nightshade)'는 이른바 '데이터 포이즈닝(Data Poisoning)'을 통해 생성형 AI에 실질적인 피해를 입힐 수 있다. 나이트쉐이드의 방어 기능을 적용한 이미지를 생성형 AI에 학습시켰을 경우 아예 원본 이미지를 다르게 인식해 기존 데이터 셋을 왜곡한다.
다만 개인의 노력에는 한계가 분명하다. 저작권이 존재하는 창작물에 대해 개인부터 기업의 무단 학습이 빈번하게 이뤄지고 있다. 웹사이트에서 콘텐츠와 데이터를 추출하는 '스크래핑 봇' 또한 원천 차단이 어려운 실정이다. 이에 창작자들 사이에서 하루빨리 AI 무단 학습을 방지할 수 있는 관련 법의 제정이 시급하다는 주장이 이어진다.
한편 글자(텍스트), 이미지(그림·사진), 음성(노래·목소리) 등 인간의 창작 영역이 AI에 의해 침해받고 있는 사례가 점점 증가하고 있다. 지난 6월, 미국 음반산업협회가 작곡 AI인 수노와 유디오를 고소한 사건이 대표적이다. 해당 생성형 AI들이 저작권이 있는 저작물들로 훈련됐다고 주장하며 곡당 15만 달러의 손해배상 판결을 법원에 요청한 것으로 알려졌다.
지난 5월에는 배우 스칼릿 조핸슨이 오픈 AI가 공개한 GPT-4o의 기본 음성이 자신의 목소리를 도용했다는 주장을 펼치기도 했다. 스칼릿 조핸슨은 2013년 개봉한 영화 '그녀(HER)'에서 인공지능 사만다의 목소리를 연기한 바 있다. 오픈AI는 스칼릿 조핸슨이 아닌 다른 성우와 작업했다고 해명했으나, 이후 논란을 의식했는지 기본 음성의 사용을 일시 중지했다.
편슬기 글로벌이코노믹 기자 pyeonhaeyo@g-enews.com