포털 네이버가 뉴스 검색시스템을 개편한다. 블로그나 카페 등에 쓰이던 유사문서판독시스템을 뉴스에도 확대 적용, 통합 검색 시 원본 기사가 가장 우선 검색되도록 한다는 것이다. 이렇게 되면 현재처럼 홍보 목적으로 뉴스를 단순 복사한 블로그나 카페, 또는 다른 기사들이 검색 결과의 상단에 등장하는 것을 막을 수 있게 된다.
NHN은 30일 서울 소공동 웨스틴조선호텔에서 기자간담회를 갖고 통합 검색 시, 유사 문서를 판별하는 ‘프로젝트 바이오(Bio)’ 시스템 개선 방안을 발표했다. 2006년부터 시작된 프로젝트 바이오는 네이버 블로그나 카페 등에 올라온 각종 문서를 문장, 구, 이미지 등으로 나눠 유사성을 비교, 독창성 정도에 따라 검색결과를 상위에 노출시키는 시스템이다. 이번 개선안은 프로젝트 바이오를 뉴스 영역에도 적용하겠다는 것. 가령 ‘구미 불산 누출 피해 보상’을 통합 검색하면 기존에는 검색 영역에 관계없이 연관성이 높은 콘텐츠나 관련 뉴스 기사를 복사한 문서가 제일 앞에 나왔지만, 앞으로는 기사가 먼저 나오게 된다.
이번 업그레이드의 핵심 기술은 통합 검색에 입력된 검색어를 보고 네티즌이 뉴스를 검색하려는 것인지 정확히 구별해 내는데 있다. 네이버 관계자는 “그간 쌓인 검색노하우를 바탕으로 입력된 키워드가 시의성이 있거나 장문일 경우 뉴스 검색의도가 높다고 보고 관련 기사를 찾는 시스템을 마련했다”고 설명했다.
이와 함께 ‘블로그 검색 반영 안내센터’도 운영, 네티즌들이 자신의 글이 유사문서로 분류된 경우 원본 반영을 요구하거나, 반대로 무단 복사된 글이 있으면 검색 제외 신고를 할 수 있게 했다.
네이버는 또 검색어의 기간별 검색 추이를 보여주는 ‘네이버 트렌드’ 서비스도 공개했다. 하루 1,800만명이 찾는 국민포털인 만큼 특정 용어의 검색 횟수나 시기 등을 통계화 하면 사회트렌드를 읽는 자료가 된다는 것. 가장 많이 검색된 키워드를 기준으로 다른 용어의 검색량이 상대값으로 나타난다. 예를 들어 ‘등산’과 ‘캠핑’이란 키워드를 함께 입력하면 등산 검색량은 점차 감소하고 캠핑이 2009년 이후 급증하는데, 이는 캠핑인구가 상대적으로 늘고 있는 흐름을 보여준다. NHN이윤식 검색본부장은 “네이버는 프로젝트 바이오를 통해 남의 글을 옮기는 이른바 ‘펌글’을 제어하는 노력을 이어나갈 것”이라고 말했다.
김현수기자 ddackue@hk.co.kr
기사 URL이 복사되었습니다.
댓글0