본문 바로가기

광고

광고닫기

광고

본문

광고

경제 IT

1107개 언어가 ‘음성↔텍스트’로…메타 AI 오픈소스 공개

등록 2023-05-24 14:18수정 2023-05-24 14:27

“언어 다양성 보존에 기여 목적”
메타 로고
메타 로고

페이스북·인스타그램 운영사 메타는 ‘대규모 다국어 음성인식(MMS)’ 인공지능(AI) 모델을 오픈소스로 공개했다고 24일 밝혔다. 오픈소스란 소프트웨어 설계도를 공개해 무료로 사용하는 것은 물론 소프트웨어를 조작·변조할 수 있게 하는 조처이다.

메타는 엠엠에스 인공지능 모델에 대해, 기존 음성인식 모델보다 10배 많은 종류의 언어를 지원한다고 설명했다. 이 업체는 “현재 사용되는 언어 수는 7천개가 넘는다. 기존 음성인식 모델은 최대 100여개 언어만을 지원하는데 비해, 이번에 공개한 엠엠에스 인공지능 모델은 1107개 언어를 음성에서 텍스트로 또는 텍스트에서 음성으로 변환하고, 음성으로 식별 가능한 언어 수도 4천개를 넘는다”고 밝혔다.

메타는 이어 “자체 분석 결과, 음성 변환 언어 수를 61개에서 1107개로 18배 늘렸을 때 오류 증가율은 0.4%에 그쳤다. 또한 챗지피티 개발업체 오픈에이아이의 음성인식 모델 ‘위스퍼’와 비교한 결과, 엠엠에스 데이터로 교육된 모델은 10배 이상 더 많은 언어를 처리하면서도 단어 오류율은 절반으로 줄이는 것으로 나타났다”고 밝혔다.

메타는 “언어 다양성 보존에 기여하고, 음성 정보에 의존하는 사람들을 비롯해 많은 사람들이 더 쉽게 정보에 접근하고 자신이 원하는 언어로 각종 기기를 사용할 수 있도록 돕는 것을 목표로 한다”며 “기존 음성 기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 지속적으로 노력할 계획”이라고 밝혔다.

김재섭 선임기자 jskim@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

경제 많이 보는 기사

매일 2740원, 매일 2025원…각양각색 ‘소액 적금’ 유행 1.

매일 2740원, 매일 2025원…각양각색 ‘소액 적금’ 유행

중국·중동 생산 급증, 석유화학 경쟁력 위기 2.

중국·중동 생산 급증, 석유화학 경쟁력 위기

오름세 증시 ‘윤석열 체포 중단’ 소식에 ‘뚝’…코스피 엿새 만에 반등 3.

오름세 증시 ‘윤석열 체포 중단’ 소식에 ‘뚝’…코스피 엿새 만에 반등

[단독] “무안공항 로컬라이저 땅 밑까지 콘크리트…의아했다” 4.

[단독] “무안공항 로컬라이저 땅 밑까지 콘크리트…의아했다”

자동차 개소세 30% 인하…3만원 숙박쿠폰 100만장 배포 5.

자동차 개소세 30% 인하…3만원 숙박쿠폰 100만장 배포

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청