◎최대자료·검색 간편 ‘정보의 보고’/한국일보 4년3개월치 26만여건 기사 한눈에/다양한 검색기능/단어 최대 4개 입력 가능한국일보사가 국내 최대규모의 기사 데이터베이스를 17일부터 일반에 공개한다. 본사의 인터넷 신문 「코리아링크(www.korealink.co.kr)」를 통해 제공하는 기사검색 서비스를 이용하면 독자들은 지난 4년3개월치의 한국일보 기사를 손쉽게 찾아볼 수 있다.
코리아링크 기사검색 시스템의 가장 큰 자랑은 엄청난 기사 보유량. 92년 10월6일자 이후의 한국일보 기사 26만여건이 들어 있다. 2만건 안팎 또는 96년 이후의 기사만 수록한 다른 국내 신문사의 인터넷DB와는 비교가 안되는 방대한 규모이다.
또다른 특징은 다양한 검색 기능. 사용자들이 쉽게 기사를 찾아볼 수 있도록 여러 기능을 도입했다. 원하는 단어(검색어)를 최대 4개까지 한꺼번에 입력해 관련기사를 모두 찾아볼 수 있는 것은 기본. 검색 결과 찾은 기사가 너무 많으면 다시 필요한 단어를 넣어 검색범위를 좁힐 수 있다(추가검색 기능). 거꾸로 「여성」을 입력한 뒤 「여성건강」 「여성계」 또는 「신여성」 「직업여성」 등 앞뒤에 그 검색어가 포함된 더 많은 자료도 찾을 수 있다(검색어확장 기능).
검색어를 넣지 않고 날짜별로 검색하는 기능도 있다. (날짜별 검색 기능) 특정한 날짜 또는 기간을 지정하면 그 기간의 기사 리스트가 모두 나온다. 기사 제목을 보고 원하는 기사를 찾아내면 된다.
검색어를 어렴풋이만 알때는 「색인어 열람」 기능을 이용하면 편리하다. 예를 들어 「국회」라고 입력하면 국회, 국회UR특위, 국회개원 등 관련 색인어를 100개까지 가나다 순으로 보여준다. 이중 자신이 원하는 정확한 단어를 찾아내 필요한 기사를 빠르게 검색할 수 있다.
검색 도중 언제라도 「기사검색」아이콘만 누르면 새로운 검색을 시작할 수 있다. 한 쪽당 보여주는 검색결과의 갯수를 10개에서 100개까지 조정할 수도 있다.
코리아링크는 한국일보에 이어 서울경제신문, 일간스포츠, 코리아타임스의 기사검색시스템도 구축, 명실상부한 국내 최대의 기사데이터베이스를 완성할 계획이다.<박승룡 기자>박승룡>
◎‘코리아링크 DB’ 이용법 이렇게/기사검색 단추 누른후 사용자 등록페이지서 ID·비밀번호 입력해야
코리아링크의 한국일보 기사검색 시스템을 이용하려면 우선 사용자 등록을 해야한다. 코리아링크 초기화면의 「기사검색」 단추를 누르면 안내문이 나타나고 「사용자등록 페이지로 가라」는 메시지가 깜박거린다. 이 메시지를 누른 뒤 지시에 따라 이름, 사용자ID, 비밀번호 등의 항목을 입력한다. 입력을 정확하게 마치면 「등록」단추를 누른다.
다음부터는 등록페이지에서 빈칸에 ID와 비밀번호만 입력하고 「시작」단추를 누르면 검색페이지로 넘어간다. 기사를 검색하는 방법은 아주 간단하다. 검색어를 이용해도 되고 날짜나 색인을 활용해도 된다.
◇한개 검색어를 이용한 간단한 검색
①검색데이터베이스 선택=그냥 통과한다. 현재는 한국일보 기사만 검색할 수 있기 때문이다.
②검색방법=「가중치 검색」과 「조건 검색」이 있다. 「조건검색」으로 설정돼 있으므로 그냥 통과한다.
③검색어 입력=원하는 검색어를 입력한다. 예를 들어 「대통령」을 넣어보자.
④검색결과=「검색시작」단추를 누르면 「대통령」이라는 단어가 포함된 과거 기사의 건수와 리스트가 모두 나타난다. 한쪽당 50개의 리스트가 표시된다. 다음 쪽을 보려면 해당 쪽 번호를 누르면 된다.
⑤새로 검색=「기사검색」단추를 누르면 새로 검색을 시작할 수 있다.
◇여러 개의 검색어를 이용할 때
①AND의 활용=검색어 입력칸에 원하는 단어를 4개까지 넣을 수 있다. 예를 들어 대통령선거, 김영삼, 김대중, 김종필이라는 4개의 단어를 빈칸에 차례로 넣고 「검색시작」 단추를 눌러보자. 조건검색 중 「AND」가 자동설정돼 있어 그냥 통과하면 된다.
「AND」는 검색어가 모두 포함된 기사만 검색하는 기능. 따라서 세사람의 이름과 대통령선거라는 단어가 모두 포함된 기사 리스트만 나타난다.
②OR의 활용=위의 4개 단어를 입력한 뒤 오른쪽에서 「OR」를 선택한다. 이는 해당 단어중 1개라도 들어있는 기사를 모두 검색하는 기능. 따라서 「AND」를 이용할 때보다 훨씬 많은 기사가 나타난다.
③ NOT의 활용=검색때 해당 단어를 제외하는 기능. 「김대중」 「김종필」을 입력한 옆에 「NOT」를 지정하면 「김영삼」과 「대통령선거」가 들어있는 기사중 나머지 두 사람의 이름이 제외된 기사 리스트만 나타난다.
◇부가 기능
▲쪽당 갯수 조절=아래쪽 「쪽당 갯수」라는 글자 옆에 「▼」단추를 포함한 작은 상자가 있다. 이 단추를 누르면 10, 30, 50, 100 등 한 쪽에서 볼 수 있는 검색결과의 수를 조절할 수 있다.
▲검색기간 지정=「970114」처럼 특정 날짜나 기간을 입력하면 해당 기간의 기사만 나타난다. 따로 지정하지 않으면 92년 이후의 기사가 모두 검색되므로 시간이 조금 더 걸린다.
▲가중치 검색=검색어가 포함된 빈도에 따라 검색하는 방법. 검색어가 많이 포함될수록 가중치가 높다. 가중치 순으로 검색 결과가 나타나므로 기사의 비중을 가늠할 수 있다. 1개 검색어를 쓸 때만 가능하다.
▲검색어 확장=「유사어 확장」 「전방일치」 「후방일치」 등 3가지 하위 기능이 있다. 「선거」를 입력하고 「전방일치」를 선택하면 선거비용 선거유세 등 앞에 「선거」가 들어간 관련 기사가 모두 나타난다. 「후방일치」를 선택하면 지방선거, 총선거 등 뒤에 검색어가 붙은 관련기사를 확장해서 검색해 준다.<박승룡 기자>박승룡>
◎‘코리아링크’와 공동개발 다센DB는/국내 첫 한국형 DBMS 적용 검색률·속도 강화
엄청난 양의 신문자료를 데이터베이스로 만들려면 자료를 저장하고 이중 원하는 것을 빨리 찾도록 순서대로 관리, 검색해 보여주는 시스템이 필요하다.
이를 DBMS(DataBase Management System:데이터베이스 관리 시스템)라 한다. DB엔진이란 DBMS중 원하는 데이터를 찾아 보여주는 검색 프로그램을 말한다.
현재 국내에서 가장 널리 사용하는 DBMS는 미오라클사의 동명제품 「오라클」. 기존 DB를 이용해 새로운 것을 만들거나 실적을 분석하는데 적합해 일반기업에서 많이 사용한다.
한국일보가 (주)다센(대표 함우엽)과 공동 개발한 인터넷신문 코리아링크DB시스템은 한국일보 기사DB에서 빠르고 정확하게 네티즌이 요청한 자료를 찾도록 검색률과 속도를 강화했다. 국내 첫 한국형DMBS를 적용한 인터넷신문답게 검색어 처리능력도 뛰어나다.
외산 시스템은 우리말의 조사 처리에 난점이 있다. 「인터넷」과 관련된 기사를 요청해도 「인터넷은」 또는 「인터넷이」라고 돼있는 기사는 찾지 못한다.
코리아링크 DB는 이런 단점을 모두 극복했다. 각국의 언어가 혼용되는 인터넷에서 한글로 검색을 의뢰하면 한문과 영어·일어·독어·불어등 다국어 정보를 함께 찾아주는 기능도 외산 시스템에서 볼 수 없는 장점이다.
코리아링크DBMS를 공동개발한 다센은 88년 9월에 설립, 90년 데이터 불법복제 및 유출방지장치인 「수문장」개발로 정보통신업계의 샛별로 떠올랐다. 93년에는 정보검색시스템인 「다센21」을 개발, 국내시장을 독식하고 있던 외산제품에 맞서 국산DBMS 시대를 열었다.
다센21은 93년 한국섬유산업연합회의 「기술정보 검색시스템」을 비롯, 한국전력공사의 「연구기술보고서 검색시스템」, 대한상공회의소의 「기업정보검색시스템」, 정보통신연구관리단의 「연구개발정보종합관리시스템」에 도입됐다.<박형배 기자>박형배>
기사 URL이 복사되었습니다.
댓글0