네이버가 성인 이미지(음란물)를 자동으로 잡아내는 인공지능(AI) 기술 개발에 성공했다. 네이버는 이 기술을 이미지 검색 시스템에 바로 적용해 인간의 능력으론 일일이 잡아내지 못했던 필터링 작업을 AI에 맡긴다는 방침이다. 과연 AI는 어떤 원리로 음란물과 정상 이미지를 분류해 내는 것일까.
네이버는 자체 개발한 음란물 필터링 AI 기술 ‘네이버 엑스-아이(X-eye)’를 이미지 검색에 적용한다고 31일 밝혔다. 기존 시스템은 중복 이미지만 걸러낼 수 있었고 이후 필터링은 이미지 모니터링 담당자들이 일일이 검수해야 해 조치가 이뤄지기 전까지 유해물이 계속 노출되는 단점이 있었다. 네이버 X-eye는 부적절한 내용을 담은 음란물이 네이버에 등록될 경우 이를 실시간으로 감지해 검색에서 노출되지 않도록 막아 준다.
우선 AI의 이미지 분석을 위해 가장 먼저 선행된 작업은 ‘반복학습’이다. 이번 기술을 적용하기 위해 네이버는 AI에 10개월 동안 이미지를 형태별로 분류하는 방법을 익히도록 공부시켰다. 그 동안 네이버에 축적된 방대한 양의 이미지가 활용됐다. 최근 X-eye로 정상 이미지와 음란물이 섞인 400만장의 이미지 필터링을 실험한 결과 98.1%의 높은 적중률을 나타냈다.
먼저 네이버 X-eye는 이미지의 각 부분을 돋보기로 보듯 확대해서 훑어본다. 한 그림의 가장 위를 왼쪽에서부터 오른쪽으로 지나가며 살펴보고, 또 아래로 조금 내려간 뒤 다시 왼쪽부터 오른쪽으로 살핀다. 이 때 확대해서 보여지는 각 부분들의 특징을 추출하게 된다.
이렇게 추출된 특징들을 모아 하나의 층(레이어)으로 쭉 펼쳐 새로운 이미지를 만들어 낸다. 그리고 이 위에 같은 작업을 반복하며 레이어가 중첩되도록 한다. 레이어를 쌓아가다 마지막 과정에 다다르면 해당 이미지에서 여러 번 겹쳐지며 추출된 정보가 음란물이 가지고 있는 공통된 특징과 얼마나 가까운지 판별할 수 있게 된다. 최종적으로 음란성이 높다고 판단되면 자동으로 검색에서 배제되는 식이다.
네이버는 X-eye가 실수하지 않도록 학습 과정에서 수백만건의 이미지를 40여가지 카테고리로 분류해 입력시켰다. 실사, 만화 및 게임, 미술그래픽 등 여러 분야로 구분해 이미지를 학습시켰고 이 과정에서 음란물이 아니지만 살색이 많아 오해할 만한 이미지 유형은 또 따로 지정해 정상 이미지로 분류되도록 했다. 운동이나 격투기 이미지인데 신체 노출이 있는 경우, 뷰티ㆍ메이크업 등 얼굴이나 특정 부위를 클로즈업 한 경우 등이 여기에 해당한다. 반대로 미처 음란물임을 감지하지 못하는 경우가 생기더라도 AI가 계속해서 학습하면서 인식률을 높일 수 있다는 게 네이버의 설명이다.
오경수 네이버 이용자생성콘텐츠(UGC)운영정책 리더는 “이번 AI 적용으로 성인 이미지에 대한 연중무휴 실시간 대응이 가능해졌다”며 “향후 동영상 필터링에도 확대 적용할 방침”이라고 말했다. 오 리더는 “건전한 인터넷 이용환경 조성을 위해 외부에도 손쉽게 사용할 수 있는 AI 필터링 프로그램 제공을 검토 중”이라고 덧붙였다.
맹하경 기자 hkm07@hankookilbo.com
기사 URL이 복사되었습니다.
댓글0