"인공지능 기반 범용 음성 번역 시스템 개발 진행"
메타버스 공간에서 전 세계인 자유롭게 소통 목표
마크 저커버그 메타 최고경영자(CEO)는 온라인으로 진행된 ‘인사이드 더 랩(Inside the Lab)’ 행사에서 '범용 음성 인공지능(AI) 번역 시스템'에 관한 연구개발을 진행하고 있다고 밝혔다. 저커버그 이번 연구가 “사람들이 이 세상 모든 사람과 어떤 언어로든 소통할 수 있는 능력을 가능하게 해줄 것”이라고 말했다.
메타는 "적은 데이터만으로도 언어 학습이 가능한 AI 모델을 구축하고, 텍스트 없이도 실시간 음성으로 언어 전환이 가능하게끔 만들겠다"는 계획이다. 메타는 이 범용 AI 번역 시스템 메타버스 사업에 적용할 계획이다.
이 야심 찬 연구의 출발점은 ‘카이라오케(CAIRaoke) 프로젝트’다. ‘자기 지도 학습’ 모델인 카이라오케는 AI 음성 비서의 소통 능력을 획기적으로 개선하는 것이 목표다. 단순한 응답 수준을 뛰어넘어 분위기에 맞게 맥락적인 대화를 할 수 있는 수준까지 끌어올리려 한다고 IT 전문매체 ZD넷 코리아가 보도했다.
또 AI 비서가 복잡 미묘한 맥락들을 좀 더 잘 잡아낼 수 있도록 하기 위해 사람 간 대화에서는 시선, 표정, 손동작 같은 정보까지 이해하도록 할 계획이다.
그다음 단계가 모든 언어를 실시간으로 통역해주는 프로젝트다.
이것도 크게 두 가지 단계로 구성돼 있다. 첫 번째는 ‘모든 언어 포괄(No Language Left Behind)’ 계획이다. 영어, 중국어처럼 많은 사람이 사용하는 언어뿐 아니라 아스투리아스, 루간다, 우르두어처럼 이용자가 적은 언어도 번역할 수 있도록 목표를 세웠다.
이용자가 적은 언어는 데이터가 부족해 기존 빅데이터 분석에 기초한 기계번역으로는 제대로 처리하는 것이 어려웠다. 메타는 데이터 부족 문제를 해결할 수 있는 AI 번역 기술을 개발하려 한다. 메타가 제시하는 솔루션은 레이저(LASER) 기술이다. 오픈소스 툴킷인 레이저는 28개 문서에 사용된 125개 이상의 언어 데이터를 수집 분석하고 있다.
현재 사용되고 있는 기계번역은 ‘두 언어 간 번역’ 방식을 주로 사용해 왔다. 이를테면 '영어 →스페인어', '독일어→ 영어' 같은 번역 방식이다. 대부분 기계번역은 영어를 중심으로 번역 망을 구축해 왔다. 메타는 ‘영어 중심’ 두 언어간 번역이란 패러다임을 바꾸는 데 초점을 맞추고 있다. 메타는 공식 페이스북 페이지에 올린 글을 통해 “최초로 영어가 중심이 되지 않은 다중언어 텍스트 번역 시스템을 만들었다"고 밝혔다. 이를 통해 전 세계 101개 언어를 포괄한다는 계획이다.
그다음 단계가 ‘범용 음성 인공지능 번역 시스템’다. 음성 언어를 실시간으로 번역하는 것은 문자를 번역하기보다 훨씬 더 어렵다. 범용 인공지능 음성 번역 시스템을 구현하기 위해선 앞에서 지적한 여러 문제를 함께 해결해야만 한다. 두 사람의 대화를 동시통역할 때는 문자 번역 때와 달리 '시간 지연’을 최소화해야 하기 때문이다. 메타는 이 문제를 해결하기 위해 문자 번역에 사용된 레이저 기술을 음성언어 쪽으로 확대 적용하고 있다.
궁극적인 목표는 음성 언어를 단순 번역하는 수준이 아니다. 메타는 모든 사람의 표현과 성격을 그대로 살리기 위해 음성 번역 때 억양 같은 요소들도 포함하기 위한 연구를 진행하고 있다고 밝혔다.
기사 URL이 복사되었습니다.
댓글0