일론 머스크 테슬라 최고경영자(CEO)가 마이크로소프트가 트위터의 데이터를 함부로 사용하고 있다며 소송을 내겠다는 뜻을 밝혔다. 정말 실행할지는 불분명하지만, 인공지능의 언어모델을 훈련하기 위한 온라인상의 데이터 확보를 둘러싼 빅테크 간 다툼이 본격화할 것으로 예상된다.
머스크는 19일(현지시각) 자신의 트위터에 “마이크로소프트가 트위터의 데이터를 불법으로 사용하며 인공지능을 훈련시키고 있다”며 “소송할 시간”이라는 글을 올렸다. 머스크는 이 글을 마이크로소프트가 25일부터 자신의 광고주 플랫폼에서 트위터를 제외할 것이라고 발표한 직후 올렸다. 마이크로소프트는 광고주들이 사회관계망서비스(SNS) 광고를 통합 관리하는 플랫폼을 운영하고 있는데, 여기서 트위터를 빼기로 한 것이다.
마이크로소프트의 ‘트위터 제외 방침’은 트위터의 정책 변경으로 인공지능 학습에 사용할 데이터 수집이 어렵게 되자 맞불을 놓은 것으로 해석되고 있다. 트위터는 29일부터 자신들의 데이터에 접근할 수 있는 응용프로그램(API)을 유료화 하는 구독 정책을 시행하겠다고 예고한 바 있다.
미국 경제매체 <시엔비시>(CNBC)는 이 같은 움직임을 두고 “데이터 소유권이 생성형 인공지능을 둘러싼 경쟁의 전쟁터가 되고 있음을 보여주는 최신 징후”라고 분석했다. 오픈에이아이(AI)가 내놓은 챗지피티(Chat GPT)와 같은 최첨단 인공지능 모델을 개발하려면 학습을 할 수 있는 대량의 데이터가 필요하다. 이 데이터는 대부분 온라인 웹사이트에서 수집되는 것으로 알려져 있다. 그 중에서도 사회관계망서비스의 데이터는 대화를 주고받는 형태여서 언어모델을 훈련시키는데 가치가 있는 것으로 평가된다. 머스크는 지난해 12월에도 인공지능 개발 기업들이 트위터 데이터를 무단으로 사용하고 있다는 점을 지적한 바 있다.
트위터 뿐만 아니라 미국의 대표적인 온라인 커뮤니티 레딧도 인공지능 개발사에게 데이터 사용과 관련해 돈을 받겠다는 방침을 밝혔다. 스티브 허프먼 최고경영자는 18일 <뉴욕 타임스>와 인터뷰에서 인공지능 개발사를 상대로 레딧 데이터를 유료화 하는 방안을 논의하고 있다고 말했다. 그는 “레딧의 언어 자료는 매우 귀중하다. 우리가 이런 자료를 기업들에게 공짜로 제공할 필요는 없다”고 말했다.
최민영 기자
mymy@hani.co.kr