네이버 개발 AI기술 ‘X-eye’
이미지 검색에 실전 투입
400만장 학습해 운동-뷰티 구분
음란물 찾기 적중률 98.1% 기록
“동영상 필터링에 확대 방침”
최근 인터넷 개인방송과 사회관계망서비스(SNS) 등에서 무분별하게 퍼지는 음란성 정보에 눈살을 찌푸리는 경우가 적지 않다. 플랫폼 사업자들도 유해정보 필터링 시스템을 갖추고는 있지만 쏟아지는 콘텐츠를 모두 점검할 완벽한 시스템을 구축하기 어렵고, 인간의 눈으로 일일이 걸러내기가 사실상 불가능하다.
짧은 시간 안에 방대한 양의 콘텐츠를 분석하는 게 ‘주특기’인 인공지능(AI)이 ‘음란물 척결’ 구원투수로 나섰다. 국내 최대 포털 네이버가 음란물을 정확히 잡아내는 AI 기술 개발에 성공했다. 네이버는 이 AI를 이미지 검색에 적용, 음란물 유통을 원천 차단하는 역할을 맡기기로 했다.
31일 네이버에 따르면 최근 네이버 이미지 관리 서버에 네이버가 자체 개발한 음란물(성인이미지) 필터링 AI 기술 ‘엑스-아이(X-eye)’가 적용되기 시작했다. 기존 시스템은 문제가 없다고 판단돼 네이버 내에서 유통되고 있는 이미지와 중복하는지 여부만 판단하는 수준이었고, 중복되지 않는 새 이미지 필터링은 모니터링 담당자들이 일일이 검수해야 했다. 담당자가 조치하기 이전에는 유해물이 이용자에게 계속 노출되는 문제를 막을 수 없었다. 이제는 사람을 대신해 X-eye가 네이버에 등록되는 음란물을 실시간으로 감지해 검색에서 노출되지 않도록 막아준다.
X-eye가 활약하기까지는 10개월에 걸친 ‘음란물 학습’ 작업이 선행됐다. X-eye는 그 동안 네이버에 축적된 엄청난 양의 이미지를 형태별로 분류하면서 음란성을 판단하는 법을 익혔다. 이미지가 들어오면 X-eye는 이미지의 각 부분을 돋보기로 보듯 확대해 훑어본다. 이 과정을 반복하면서 확대된 부분의 특징과 음란물의 특징을 비교한다. 부합하는 정도가 일정 수준을 넘기면 자동 차단하는 식이다. 실제 서비스에 적용하기 전 정상 이미지와 음란물이 섞인 400만장의 이미지 필터링 내부 실험 결과 X-eye의 음란물 적중률은 무려 98.1%를 기록했다.
높은 정확도는 X-eye의 음란성 판단 기준은 ‘살색이 얼마나 많은지’ 정도의 수준이 아님을 보여준다. 네이버는 X-eye를 가르치면서 수백만 건의 이미지를 40여 가지 카테고리로 분류해 입력시켰다. 단순히 음란물인 것과 아닌 것만 나눈 게 아니라 만화, 게임, 미술그래픽, 실제 촬영 사진 등 다양한 분야로 구분해 학습시켰다.
또 음란물로 오해할 만한 이미지들은 별도 유형으로 지정해 정상 이미지로 판단하도록 했다. 운동이나 격투기 이미지이지만 신체 노출이 있는 경우, 뷰티ㆍ메이크업 관련 이미지인데 얼굴이나 특정 부위가 부각(클로즈업)된 경우, 문신ㆍ보디페인팅 등 성적 의도가 없는 노출 등에 대해서 X-eye는 ‘정상’으로 판단한다.
네이버는 X-eye를 이미지뿐 아니라 동영상 분석에도 확대할 계획이다. 네이버 관계자는 “X-eye는 사람처럼 배우는 인공 신경망을 기반으로 해 분석을 반복하면서 더 많은 내용을 학습한다”며 “앞으로 X-eye가 분석하는 데이터가 늘어날수록 적중률은 더 높아질 것”이라고 밝혔다.
맹하경 기자 hkm07@hankookilbo.com
기사 URL이 복사되었습니다.
댓글0