사용자: "가까운 음식점을 찾아봐"
시스템: "한식과 중식, 일식 중 어떤 음식점을 찾을까요?"
사용자: "여기서 제일 가까운 데로…."
시스템: "세 곳을 추천 드립니다."
사용자: "첫 번째로 가자."
시스템: "길 안내를 시작하겠습니다."
영화 속 미래가 현실로 다가오고 있다.
아직은 시뮬레이션 단계지만, 이 시스템은 현재 한국전자통신연구원(ETRI)에서 2013년 상용화를 목표로 세부 기술(자연어 음성인터페이스) 개발에 착수한 상태다. 음성인식 기술이 스마트해지면서 본격적인 유비쿼터스 시대도 앞당겨지는 셈이다. 국내 음성인식 핵심 기술의 싱크탱크로 알려진 한국전자통신연구원(ETRI)의 음성ㆍ언어정보연구부를 찾아가 봤다.
"(단말기에서) 음성인식 지수를 높이려면, 결국 주변 잡음에 어떻게 효과적으로 대처하느냐가 관건이 될 텐데요."
"평상시 잡음(40~60데시벨)이 나오는 범위를 좀 더 확대시킨 다음, 테스트를 하면서 인식률을 높여가는 방법을 찾아 봅시다. 더 극한 상황에서 실험을 해 나가다 보면 정확성을 높일 수 있는 방법이 나올 것도 같습니다만.…"
2일 대전에 있는 ETRI내 음성ㆍ언어정보연구부. 이 곳에서 음성인식 기술을 분석 중인 조훈영(38) 박사와 윤승(36) 연구원의 표정은 진지했다. 각자 실험용 스마트폰과 네비게이션을 손에 쥐고 심도있게 대화를 나누면서도, 이들의 시선은 음성인식 테스트 결과 주파수가 표시된 컴퓨터(PC) 모니터에 고정됐다.
국내 음성인식 원천 기술(국내외 관련 특허 출원 210여건, 2010년7월말 기준)의 대부분을 잉태시킨 이 곳은 요즘 평균 90% 이상 올라온 음성인식률을 100%까지 끌어 올리기 위한 연구에 한창이다. 입력되는 음성 특징을 추출해 이미 (단말기내) 저장된 유사 단어나 문장에 연결시켜 문자로 바꿔주는 음성인식 기술은 자동차와 휴대폰, 지능형 로봇 및 국방, 홈네트워크, 언어 교육 등 응용 범위도 무한하다. 글로벌 기업인 마이크로소프트(MS)와 구글 등이 막대한 비용을 투자하면서 음성언어 기술 개발에 박차를 가하고 있는 것도 이 때문이다.
지난해 11월말 국내 최초로 개발한 음성 모바일 지능형 검색 기술(2006년3월 국책과제 선정) 역시 이 곳 작품이다. 다음이 국내 포털 업체 가운데선 처음으로 선보인 아이폰용 음성 검색 서비스(2010년6월)도 이 곳 기술을 응용했다.
ETRI 음성ㆍ언어정보연구부를 이끌고 있는 박상규(52) 박사는 "음성 인식률을 높이기 위한 관건은 많은 음성 데이터베이스(DB)를 확보하는 것"이라며 "현재도 전국 각지에서 서로 다른 사람들의 음성과 발음 등을 녹음해 데이터베이스를 축적하고 있다"고 전했다.
하지만 취약한 국내 인프라는 음성인식 기술 선점의 걸림돌이다. 기술력에 관한 한 선진국과 대등한 상태지만 전문 인력 등을 비롯한 기본 인프라는 취약하기 때문이다. ETRI내에서도 음성언어 기술 전문 연구 인력은 50명에 불과하고, 관련 국내 벤처기업도 손가락에 꼽을 정도다. 음성인식 기술에 대한 잠재 성장성을 감안하면 열악한 수준이다.
박 박사는 "틈새시장을 열어 줄 것으로 기대되는 차세대 음성인식 기술에 국가적인 차원에서 보다 많은 관심과 지원이 더해진다면 관련 중소기업이 연계된 새로운 형태의 산업생태계를 창출할 수 있을 것"이라고 말했다.
대전=허재경기자 ricky@hk.co.kr
기사 URL이 복사되었습니다.
댓글0