◎PC연결땐 음성출력·외국어 자동 번역도/작년 소프트웨어 첫선 산더미처럼 쏟아지는 서류나 몇분이 멀다하고 날아드는 팩스를 컴퓨터에 저장하기 위해 손가락이 아프도록 키보드를 두드릴 필요가 없다. 엄청난 분량의 자료를 데이터베이스화하기 위해 몇달을 밤샘할 필요도 없다. 책 신문등 인쇄물의 정보를 컴퓨터 보조입력장치인 스캐너로 사진찍듯이 읽어들이고 이를 문자정보로 바꿔주는 광학적 문자인식(OCR·OPTICAL CHARACTER RECOGNITION) 시스템이 발전을 거듭, 타자수의 일을 훨씬 빨리 대신해주기 때문이다.<관련기사 34면>관련기사>
문자인식시스템은 인쇄문자를 읽어들여 컴퓨터에서 사용되는 이미지 파일로 바꾸는 스캐너와 이를 다시 편집·수정이 가능하도록 문자코드로 바꿔주는 문자인식소프트웨어로 구성돼 있다. 문자인식시스템은 문서입력외에 회사내 문서관리및 시각장애자용 컴퓨터, 외국어자동번역시스템 등에 널리 응용된다.
기존 문서보존 광파일시스템이 문서를 화상으로 인식해 컴퓨터 기억용량의 낭비가 많았던 데 반해 문자인식시스템은 정보를 문자코드로 바꿔 저장하기 때문에 저장용량을 줄일 수 있어 문서관리에 효율적이다.
문자인식시스템을 음성합성카드가 장착된 PC와 결합시키면 인식내용을 음성으로 출력할 수 있어 시각장애자용 컴퓨터로 활용할 수 있다. 국내에서도 지난해 소설등을 스캐너로 읽어들여 맹인에게 읽어주는 컴퓨터도 등장했다.
문자인식시스템은 또 외국원서를 한글로 바꿔주는 자동번역시스템, 손으로 쓴 전표등을 자동인식하여 분류하는 전표입력시스템 등에 이용되고 있다. 자동번역시스템의 경우 시스템공학연구소(SERI)가 90년 일본후지쓰(부사통)사와 일·한 번역시스템을 개발했고 한국과학기술원(KAIST)은 92년부터 러·한 기계번역 시스템개발에 나섰다.
문자인식시스템의 핵심기술은 한자 영문 한글 등 다양한 종류의 문자와 문자체를 얼마나 정확하고 빠르게 읽어내는 것이다. 이를 위해 신경망이론 패턴인식 등 인공지능분야의 첨단이론이 총동원되고 있다. 즉 인간이 학습을 통해 지식을 얻는 것처럼 문자인식시스템도 점차 축적되는 정보를 통해 컴퓨터가 스스로 학습하도록 하는 것이다. 이러한 첨단이론을 이용하여 영문에 비해 다양한 글꼴과 복잡한 획수를 갖고 있는 한글문장을 최소 90% 이상 인식할 수 있는 문자인식소프트웨어가 선보이고 있다. 이런 시스템은 숙달된 타자수보다 6∼8배 빠른 초당 30∼40자이상의 속도로 문장을 입력할 수 있다.
문자인식시스템 기술의 파급효과와 무한한 활용성에 주목한 선진국은 이미 70년대부터 시스템을 개발해 팔고 있다. 국내에선 20∼30년이 늦은 80년대말 경북대 충북대 한국과학기술원 시스템공학연구소등에서 연구를 시작, 지난해초 이들의 기반기술을 이용한 문자인식소프트웨어가 선보였다. 스캐너는 국내서 개발이 안돼 대만 일본 미국산 수입 제품들이 판매되고 있다.
삼홍시스템의 백홍기 사장은 『문자인식시스템은 활용범위가 넓어 일본의 경우 국가적 개발과제로 선정해 활발한 연구가 이뤄지고 있다』며 『수년내에 컴퓨터이용자들을 키보드로부터 해방시키는 사무자동화의 기수로 등장할 것』이라고 말했다.<홍덕기 기자>홍덕기>
기사 URL이 복사되었습니다.
댓글0