메타의 최고경영자 마크 저커버그는 23년 7월18일 페이스북을 통해 자사의 거대언어모델 라마2를 오픈소스로 개방해 누구나 활용할 수 있게 한다고 밝혔다.
2022년 말 오픈에이아이(OpenAI)의 챗지피티(ChatGPT) 공개 이후 생성 인공지능의 신세계를 둘러싼 정보기술계의 경쟁과 대응이 한층 복잡하고 예측이 어려운 모습으로 펼쳐지고 있다. 통제할 수 없는 인공지능 개발을 6개월간 잠정 중단하자는 성명과 핵무기에 비교하는 경고가 잇따랐는데, 이번엔 인공지능을 누구나 가져다가 마음껏 활용하라고 ‘오픈소스 인공지능’이 공개됐다. 생성 인공지능 개발을 둘러싸고 왜 이런 상반된 움직임이 생겨나고 있을까?
■ 메타, 인공지능 라마2 오픈소스 공개
페이스북의 모회사 메타는 지난 18일 거대언어모델 ‘라마2(Llama)’를 오픈소스로 공개한다고 밝혔다. 메타의 최고경영자 마크 저커버그는 이날 자신의 페이스북 페이지를 통해 “소프트웨어가 개방돼 있으면 더 많은 사람이 문제를 찾아내고 식별하고 해결할 수 있어 안전과 보안을 향상시킬 수 있다”고 오픈소스 개방이 혁신을 촉진할 것이라고 말했다.
메타의 라마2 오픈소스화는 인공지능의 설계도(소스코드)를 공개하고 누구나 가져다가 수정·재개발할 수 있도록 하는 것이어서, 오픈에이아이가 응용프로그램 개발도구(API)를 통해 자사 모델의 덩치를 키우는 것과는 차원이 다르다. 메타는 라마2의 성능이 지난 2월 연구자들을 대상으로 공개한 모델(라마1)보다 40% 늘어난 데이터를 학습하고 구조가 개선됐지만, 지피티4에 미치지는 못한다고 인정했다. 라마2의 장점은 ‘오픈소스’와 ‘경량화’다. 라마2는 매개변수(파라미터) 규모에 따라 3가지 모델(70억개, 130억대, 700억개)로 제공돼, 거대한 컴퓨팅 자원을 갖출 수 없는 신생기업이나 개발자도 적절한 모델을 이용해 자신만의 인공지능을 개발하고 상업적으로 활용할 수 있게 했다. 메타는 개발자가 수집한 데이터를 활용하는 방법에 대한 상세한 안내도 제공하며 라마2를 통한 인공지능 오픈소스 생태계의 실질적 활성화에 나서고 있다.
■ AI 생태계에 끼칠 영향
생성 인공지능 구축에는 천문학적 자금과 자원이 필요해 빅테크기업의 전유물로 여겨졌다. 오픈에이아이는 마이크로소프트로부터 100억달러(약 13조원)를 지원받는 대가로 지분을 줬고, 거대언어모델 구축에 활용되는 엔비디아의 그래픽칩(GPU) 모듈(H100)은 하나에 6천만원에 이를 정도지만 공급 부족을 겪고 있다. 메타의 라마는 생성 인공지능의 문턱을 크게 낮췄다. 지난 3월 스탠퍼드대 연구진은 라마1을 활용해 챗지피티와 유사한 성능의 소형 생성인공지능 ‘알파카’를 개발했다고 공개했다. 연구진은 클라우드 컴퓨팅을 활용해 개발에 총 600달러(약 78만원)이 들었다고 밝혀, 인공지능 대중화 시대를 예고했다. 이번 개방이 수많은 기업과 개발자들을 개발에 뛰어들게 해 인공지능 생태계의 대중적 활성화 계기가 될 것으로 주목받는 이유다.
오픈소스는 비상업성을 내걸지만, 후발 기업이 선도 기업을 따라잡기 위한 전략으로 활용되기도 한다. 구글은 애플이 장악한 스마트폰 시장에 뛰어들면서 안드로이드 모바일을 오픈소스로 공개해 개발과 이용을 활성화하는 전략을 썼고 성공했다.
다크웹에 생겨난 유료 생성인공지능 웜지피티, 월 100달러를 내면 피싱메일과 악성코드 등 범죄용 코드를 작성해준다.
■ 향후 어떤 일이 생겨날까?
인공지능 기술 경쟁이 치열해지면서 비공개와 비밀주의가 강화되고 있는 상황에서 메타의 오픈소스화는 눈길을 끄는 시도다. 오픈에이아이는 인공지능 기술과 데이터의 공개를 내걸고 비영리법인으로 출범했지만 경쟁이 본격화하자 기술과 데이터를 비공개로 전환하고 영리법인도 설립했다. 지피티4는 데이터의 매개변수 규모조차 비밀로 하고 있으며, 지난 3월 공개한 지피티4은 멀티모달 기능을 시연했을 뿐 접근도 허용하지 않고 있다.
라마2의 오픈소스화는 인공지능 악용가능성에 대한 우려도 낳고 있다. 메타 경영진은 인공지능을 쓰지 않고도 허위정보와 혐오 발언이 쏟아지는 상황에서 기술의 오픈소스화가 오용을 막는 방책이 될 수 있다고 주장한다.
저커버그는 라마2의 오픈소스화를 밝히며 “여러분들이 뭘 만들지 기대하고 있다”며 다양한 기능과 목적의 인공지능 모델의 출현을 예고했다. 한편 다크웹에는 피싱메일과 악성코드 등 범죄용 코드를 작성해주는 유료 생성인공지능 웜지피티(월 100달러) 같은 사례가 이미 등장한 상태다. 소스코드가 공개된 인공지능은 얼마든지 범죄도구 제작용으로 손쉽게 활용된다는 걸 보여준다. 웬디 홀 영국 사우샘프턴대 교수는 “기술업계가 거대언어모델을 자율규제할 수 있을지 의문이며 오픈소스 모델은 사람들에게 핵폭탄을 만들 수 있는 도구를 제공하는 것과 비슷하다”고 지난 19일 <가디언> 인터뷰를 통해 밝혔다.
구본권 사람과디지털연구소장
starry9@hani.co.kr