#1
구글 듀플렉스, 미용실 전화 예약
직원은 상대방이 기계인지 몰라
네이버도 사람 목소리 모방 시연
#2
반세기만에 테스트 통과 기대
채팅 내용만으로 사람-기계 구분
업계 “완벽히 속는 수준까진 2년”
#올여름 구글이 시범 운영을 시작하는 '구글 듀플렉스'는 인공지능(AI)이 사람 대신 전화를 걸어서 상대방과 통화도 하고, 알아서 결정도 내린다. 듀플렉스는 목표한 시간에 예약이 실패하자 시간을 바꾸는 유연성을 보여주고, 잠시 기다리라는 말에 대답 대신 사람처럼 ‘으흠’ 등의 소리를 냈다. 듀플렉스와 대화하던 미용실 직원은 통화가 끝날 때까지 상대가 기계인지 알아차리지 못했다.
#네이버에서 개발한 화자 인식 기술은 4시간 분량의 음성 샘플만 있으면 한 사람의 목소리를 비슷하게 따라 한다. 실제로 지난달 28일 일본에서 진행된 ‘라인 콘퍼런스’에서는 라인 최고마케팅책임자(CMO)가 자신의 목소리로 말하는 AI 스피커와 대화하는 장면을 시연하기도 했다. KT 기가지니도 5월 개그맨 박명수 목소리로 즐기는 퀴즈게임을 내놨으며, 조만간 ‘엄마 목소리로 읽어주는 동화’ 등 새로운 서비스를 선보일 예정이다.
AI 기술의 비약적인 발달로 사람과 기계가 구별이 되지 않는 수준에 가까워졌다. 예상치 못한 상황에도 적절한 대답을 찾아내는 등 점점 ‘사람 같아지는’ 현재 AI 기술에 대해 전문가들은 튜링 테스트 통과도 멀지 않았다고 평가한다.
튜링 테스트는 1950년 영국의 수학자 앨런 튜링이 제안한 실험으로, 기계가 인간 수준의 지능이 있는지 판별하는 기준이다. 질문자가 컴퓨터 화면을 통해 두 응답자(컴퓨터와 사람)와 대화하는데, 이때 질문자는 어느 쪽이 컴퓨터인지 알지 못하는 상태다. 일정 개수의 문답을 주고받은 뒤 질문자가 둘 중 어느 쪽이 사람인지 구분해내지 못하면 응답자 컴퓨터는 테스트를 통과한다. 텍스트로 사람을 속이는 것이 튜링 테스트의 1단계라면 다음은 이미지를 구분해내는 기술, 마지막은 자연스러운 목소리로 대화를 주고받는 수준이다.
AI 스타트업 ‘네오사피엔스’의 김태수 대표는 “현재의 AI는 튜링 테스트 통과가 어려운데 그 이유는 AI가 아니라 사람이 불완전하기 때문”이라고 말했다. 사람은 대화 도중 엉뚱한 얘기를 해도 적절히 대응하지만, 현재 AI 기술로는 특정한 맥락이 있거나 목표를 달성하기 위한 대화만 가능하다는 것이다. 김 대표는 “같은 문장이라도 어떤 단어를 강조하냐에 따라 풍기는 뉘앙스가 다른데, AI는 아직 이걸 구분하지 못한다”면서도 “이 부분까지 해결되면 음성 튜링 테스트도 통과할 수 있을 것”이라고 밝혔다.
음성합성 분야에서도 아직 “갈 길이 멀다”는 평가가 나온다. 박정석 KT 융합기술원 팀장은 “아직은 실제로 들리는 소리와 오디오 파일로 재생됐을 때 소리 사이에 차이가 있다”면서 “완벽히 구분되지 않는 수준에까지 이르기 위해서는 2년 정도의 시간은 더 필요할 것”이라고 말했다.
AI 기술이 빠르게 사람과 비슷해지면서 이를 악용한 사회적 범죄와 프라이버시 침해 가능성에 대한 우려가 나온다. 튜링 테스트를 통과할 정도의 기술이 등장하면 가족의 목소리를 복제해 보이스피싱에 이용하거나, 개인 기기를 해킹해 원하지 않는 행동을 하도록 만들 수 있기 때문이다. 박정석 팀장은 “음성합성의 경우 오디오 파일 자체에 워터마크 등 기계음임을 증명할 수 있는 표식을 넣도록 규격화해 법으로 규제할 필요가 있다”고 말했다. 구글도 듀플렉스 공개 직후 제기된 비판에 최근 “통화를 시작할 때 통화 주체가 구글 어시스턴트라는 사실을 밝히고, 통화 내용이 녹음된다는 사실을 공개하겠다”는 방침을 내놓았다.
그러나 모든 AI 음성을 규제하는 것은 산업 발전을 저해한다는 의견도 있다. 김태수 대표는 “좋아하는 연예인 목소리로 깨워주는 알람 등 ‘기꺼이 속고 싶은’ 상황도 있을 것”이라며 “일률적인 규제는 산업 발전에 악영향을 주기 때문에 어느 정도의 융통성이 필요할 것”이라고 말했다.
곽주현 기자 zooh@hankookilbo.com
기사 URL이 복사되었습니다.
댓글0