오픈 AI가 뉴욕타임스의 고소에 대해 공개적으로 반박했다. 오픈 AI는 반박글에서 뉴욕타임스의 소송의 주장에 동의하지 않지만 이 기회를 활용해 자사의 사업, 의도, 기술 구축 방법을 명확히 하겠다며 4가지를 주장했다.
아래는 오픈 AI 입장문의 4가지 주요 주장들이다.
- 오픈AI는 언론사와 협업해 새로운 기회 창출하고 있다
- 교육에 뉴스를 사용하는 것은 공정 사용이지만, 거부할 수 있는 옵션도 제공했다
- ‘역류(듣거나 읽은 내용을 그대로 반복하는 것)는 희귀한 버그일 뿐이다.
- 뉴욕타임스는 전체 내용을 말하지 않았음
오픈AI 반박 1 : 언론사와 협업해 새로운 기회 창출
- 오픈 AI는 (미국의) 뉴스 미디어연합 등 수십 개사를 만나 논의하고 있음
- 오픈 AI의 목표는 건강한 뉴스 생태계 지원, 좋은 파트너 되기, 상호이익이 되는 기회를 창출하는 것이며 이를 위해 언론사와 파트너십을 추구해왔음
- 1, 방대한 공공 기록 분석 및 기사 번역과 같이 시간이 많이 걸리는 작업을 지원해 기자와 편집자에게 혜택을 주고 지원하기 위해 제품을 배포함.
- 2. 추가로 비공개로 제공되는 역사적 콘텐츠를 훈련하여 AI 모델에 세상에 대해 가르
- 3. ChatGPT에 속성이 포함된 실시간 콘텐츠를 표시하여 뉴스 게시자가 독자와 연결할 수 있는 새로운 방법을 제공함
- AP, Axel Springer, American Journalism 프로젝트(500만달러 상당의 API 크레딧 제공) 뉴욕대약 40만달러의 보조금 지원한 윤리 및 저널리즘 이니셔티브 신설)와의 파트너십이 그 증거임
반박 2 : 교육에 뉴스를 사용하는 것은 공정 사용
- 공개적으로 이용 가능한 인터넷 자료를 사용하여 AI 모델을 훈련시키는 것은 오랫동안 지속되고 널리 받아들여지는 선례에 의해 뒷받침되는 공정 사용임
- 유럽연합, 일본, 싱가포르, 이스라엘 등 다른 국가에서도 법으로 저작권 있는 콘텐츠에 대한 훈련 모델을 허용함. 이는 AI 혁신, 발전 및 투자에 유리함
- AI 모델 훈련이 공정한 사용으로 허용된다는 원칙은 최근 미국 저작권청에 의견을 제출한 학계 , 도서관 협회 , 시민 사회 단체 , 스타트업 , 미국 선도 기업 , 창작자 , 작가 및 기타 다양한 분야에서 지지를 받고 있음
- 좋은 시민이 될 권리는 법적 권리보다 더 중요함. 구글은 언론사가 AI 콘텐츠 크롤링을 거부할 수 있도록 했음.(뉴욕타임스는 2023년 8월에 이를 선택함)
반박 3 : 역류는 희귀한 버그일뿐
- 기억(memorization : 뉴욕타임스가 고소장에서 주장한 자사 기사를 동일하게 반복하는 것)은 희귀한 버그일뿐이고 이를 방지하기 위한 조치를 취했음
- 의도적으로 GPT를 조작해 역류하는 것은 오픈 AI의 적절한 사용이 아니며 이용 약관에 어긋남
- GPT는 인간 지식의 엄청난 집합체로부터 학습하기 때문에 뉴스의 한 분야는 전체 교육 데이터의 작은 부분이며 뉴욕타임스를 포함한 단일 데이터 소스는 GPT모델의 학습에 중요하지 않음
뉴욕타임스는 전체 내용을 말하지 않았음
- 뉴욕타임스와는 2023년 12월 19일이 마지막
- 협상은 챗GPT 속성이 포함된 실시간 노출을 중심으로 한 고부가가치 파트너십에 초점을 뒀음. 뉴욕타임스의 현재 독자와 신규 독자를 연결하는 방법이고 오픈 AI의 사용자는 뉴욕타임스를 조회할 수 있는 방법임
- 뉴욕타임스의 콘텐츠가 GPT 모델의 학습에 의미있는 기여가 없었고 앞으로도 그럴 것이라고 설명했음
- 오픈 AI는 뉴욕타임스의 일부 콘텐츠가 역류하는 것을 조사하고 수정하겠다고 제안했지만 거절당함
- 오픈AI는 작년 7월 의도하지 않은 방법으로 실시간 콘텐츠가 표현되는 것을 알고 GPT 기능을 중단할 정도로 우선순위로 삼고 있음
- 뉴욕타임스가 만들어낸 역류 현상은 제 3자 웹사이트에 급증한 오래된 기사에서 나옴. 뉴욕타임스가 이 역류 현상을 위해 의도적으로 수차례 프롬프트를 조작한 것으로 보임
- 그럼에도 이런 오용은 일반적인 사용자 활동이 아니기에 뉴욕타임스를 대체할 수 없음
- 오픈AI는 훈련 데이터를 역류시키는 적대적 공격에 대한 시스템 저항력을 높이기 위해 지속적으로 노력 중이며 이미 진전을 이뤘음
오픈 AI는 뉴욕타임스의 소송이 가치 없다고 보지만 그럼에도 불구하고 뉴욕타임스와의 건설적인 파트너십을 희망했다. 또한, 60년전 최초의 작동하는 신경망을 보도하고, 수정헌법 제1조의 자유를 위해 싸워온 역사를 가진 뉴욕타임스를 존중한다고 밝혔다.
앞으로도 오픈 AI와 뉴욕타임스는 언론계와 AI테크의 치열한 법정 다툼 외에도 논리 싸움과 여론전을 이어갈 것으로 보인다.
특이사항 – 오픈 AI, 네이버 카페를 학습한 증거
오픈 AI의 반박문 원문 중 네번째 주장 : 뉴욕타임스가 전체 내용을 말하지 않았음(The New York Times is not telling the full story)에서 오픈 AI가 네이버 블로그를 학습한 것으로 나타났습니다. 반박문 4번 중 “multiplle third-party websites” 에서 “third”를 클릭하면 특정 네이버 블로그로 이동합니다.
(끝)
관련 뉴스
거북이 미디어 전략 연구소장은 미디어의 온라인 수익화와 전략에 주요 관심을 가지고 있습니다.
저는 Publisher side에서 2015년부터 모바일과 PC 광고를 담당했습니다. 2022년부터 국내 포털을 담당하고 있습니다.
▲ 강의 이력
구글 디지털 성장 프로그램의 광고 워크샵 게스트 스피커(21년 6월)
구글 서치콘솔, 네이버 서치어드바이저, MS 웹마스터 도구 사용법(24년 8월 한국 언론진흥재단 미디어교육원)