본문 바로가기

광고

광고닫기

광고

본문

광고

경제 IT

1107개 언어가 ‘음성↔텍스트’로…메타 AI 오픈소스 공개

등록 2023-05-24 14:18수정 2023-05-24 14:27

“언어 다양성 보존에 기여 목적”
메타 로고
메타 로고

페이스북·인스타그램 운영사 메타는 ‘대규모 다국어 음성인식(MMS)’ 인공지능(AI) 모델을 오픈소스로 공개했다고 24일 밝혔다. 오픈소스란 소프트웨어 설계도를 공개해 무료로 사용하는 것은 물론 소프트웨어를 조작·변조할 수 있게 하는 조처이다.

메타는 엠엠에스 인공지능 모델에 대해, 기존 음성인식 모델보다 10배 많은 종류의 언어를 지원한다고 설명했다. 이 업체는 “현재 사용되는 언어 수는 7천개가 넘는다. 기존 음성인식 모델은 최대 100여개 언어만을 지원하는데 비해, 이번에 공개한 엠엠에스 인공지능 모델은 1107개 언어를 음성에서 텍스트로 또는 텍스트에서 음성으로 변환하고, 음성으로 식별 가능한 언어 수도 4천개를 넘는다”고 밝혔다.

메타는 이어 “자체 분석 결과, 음성 변환 언어 수를 61개에서 1107개로 18배 늘렸을 때 오류 증가율은 0.4%에 그쳤다. 또한 챗지피티 개발업체 오픈에이아이의 음성인식 모델 ‘위스퍼’와 비교한 결과, 엠엠에스 데이터로 교육된 모델은 10배 이상 더 많은 언어를 처리하면서도 단어 오류율은 절반으로 줄이는 것으로 나타났다”고 밝혔다.

메타는 “언어 다양성 보존에 기여하고, 음성 정보에 의존하는 사람들을 비롯해 많은 사람들이 더 쉽게 정보에 접근하고 자신이 원하는 언어로 각종 기기를 사용할 수 있도록 돕는 것을 목표로 한다”며 “기존 음성 기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 지속적으로 노력할 계획”이라고 밝혔다.

김재섭 선임기자 jskim@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

경제 많이 보는 기사

‘3조원 비과세 배당’ 우리금융 주가 급등…감액 배당이 뭐죠? 1.

‘3조원 비과세 배당’ 우리금융 주가 급등…감액 배당이 뭐죠?

3월 대체거래소 ‘넥스트레이드’ 출범…주식거래 어떻게 운영되나 2.

3월 대체거래소 ‘넥스트레이드’ 출범…주식거래 어떻게 운영되나

신규 상장기업 주식 100억 이상 ‘신흥 주식부자’, 지난해 124명 탄생 3.

신규 상장기업 주식 100억 이상 ‘신흥 주식부자’, 지난해 124명 탄생

마지막 ‘줍줍’…세종 무순위 아파트 3가구 120만명 몰렸다 4.

마지막 ‘줍줍’…세종 무순위 아파트 3가구 120만명 몰렸다

“대규모 세수결손 없을 것”이라더니…2년 연속 수십조 결손 5.

“대규모 세수결손 없을 것”이라더니…2년 연속 수십조 결손

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청