지의소프트(대표 김영호)는 고객이 보유하고 있는 데이터의 가치를 찾기 위한 빅데이터 분석 컨설팅, 챗봇 서비스 구축, 문서 내 정보를 활용한 검색 서비스 등을 제공하는 연구중심의 회사이다.
최근 국내 특허 등록이 완료된 ‘딥러닝 알고리즘을 이용한 문서 데이터 저장 시스템’은 한글 및 워드와 같은 일반 문서에서 이미지의 유사도 판별에 최적화된 딥러닝 알고리즘을 활용해 문서에 포함돼 있는 테이블(표) 정보를 추출해 저장할 수 있는 기술이다.
일반 기업 및 공공기관, 특히 연구기관(대학 및 정부출원연구소 등)에서는 개방된 데이터뿐만 아니라 대외 기관에서 배포하는 각종 문서에서 정보를 찾고 누적해 각종 통계 및 연구자료에 활용하는 일들이 비일비재하다. 기존에는 수작업을 통해 저장하거나 문서의 포맷별 텍스트 필터를 통해 텍스트를 추출하거나, 특정 위치의 텍스트를 추출하려면 형식을 지정하는 방식으로 정보를 추출해 저장하는 것이 일반적이었다.
지의소프트가 최근 선보인 기술은 인공지능 알고리즘을 활용해 자동으로 문서에 포함돼 있는 테이블 형식을 인식하고, 테이블 내 텍스트 데이터를 추출해 엑셀 및 DB 저장할 수 있다.
기사 URL이 복사되었습니다.
댓글0