페이스북·인스타그램 운영사 메타는 ‘대규모 다국어 음성인식(MMS)’ 인공지능(AI) 모델을 오픈소스로 공개했다고 24일 밝혔다. 오픈소스란 소프트웨어 설계도를 공개해 무료로 사용하는 것은 물론 소프트웨어를 조작·변조할 수 있게 하는 조처이다.
메타는 엠엠에스 인공지능 모델에 대해, 기존 음성인식 모델보다 10배 많은 종류의 언어를 지원한다고 설명했다. 이 업체는 “현재 사용되는 언어 수는 7천개가 넘는다. 기존 음성인식 모델은 최대 100여개 언어만을 지원하는데 비해, 이번에 공개한 엠엠에스 인공지능 모델은 1107개 언어를 음성에서 텍스트로 또는 텍스트에서 음성으로 변환하고, 음성으로 식별 가능한 언어 수도 4천개를 넘는다”고 밝혔다.
메타는 이어 “자체 분석 결과, 음성 변환 언어 수를 61개에서 1107개로 18배 늘렸을 때 오류 증가율은 0.4%에 그쳤다. 또한 챗지피티 개발업체 오픈에이아이의 음성인식 모델 ‘위스퍼’와 비교한 결과, 엠엠에스 데이터로 교육된 모델은 10배 이상 더 많은 언어를 처리하면서도 단어 오류율은 절반으로 줄이는 것으로 나타났다”고 밝혔다.
메타는 “언어 다양성 보존에 기여하고, 음성 정보에 의존하는 사람들을 비롯해 많은 사람들이 더 쉽게 정보에 접근하고 자신이 원하는 언어로 각종 기기를 사용할 수 있도록 돕는 것을 목표로 한다”며 “기존 음성 기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 지속적으로 노력할 계획”이라고 밝혔다.
김재섭 선임기자
jskim@hani.co.kr