읽는 재미의 발견

새로워진 한국일보로그인/회원가입

  • 관심과 취향에 맞게 내맘대로 메인 뉴스 설정
  • 구독한 콘텐츠는 마이페이지에서 한번에 모아보기
  • 속보, 단독은 물론 관심기사와 활동내역까지 알림
자세히보기
특허분야 자연어 처리에 최적화한 신규 AI 언어모델 KorPatELECTRA 확대 보급 실시
알림
알림
  • 알림이 없습니다

특허분야 자연어 처리에 최적화한 신규 AI 언어모델 KorPatELECTRA 확대 보급 실시

입력
2022.08.29 09:20
0 0

한국특허정보원(원장 강경호, 이하 ‘정보원’)은 지식재산(IP) 분야에 특화된 고성능 인공지능 언어모델인 KorPatELECTRA를 확대 보급하겠다고 밝혔다.

정보원은 지난해 AI 언어 모델 KorPatBERT를 공개한 바 있다. 올해 새롭게 보급하는 KorPatELECTRA는 Google社에서 기존 언어모델 BERT 보다 학습 효율과 성능을 향상시키기 위해 개발한 최신 언어모델 ELECTRA를 기반으로 구축한 언어모델이다. KorPatELECTRA는 특허분야 한국어 자연어처리에 적합하도록 국내 특허문헌 약 466만건에 포함된 5억4천만 문장을 학습하여 구축하였다.

기존 언어모델과의 성능 비교 결과 KorPatELECTRA는 개체명 인식과 기계독해 분야에서 뛰어난 성능을 보였으며, 이를 통해 지능형 IP정보서비스 구축 시 언어모델 선택의 폭을 넓혀 줄 수 있을 것으로 기대된다.

신규 언어모델의 상세한 구축 과정과 학술적 성과는 추가적인 연구로 확장될 수 있도록 논문발표를 통해 내용을 공유하였고, 연구의 우수성을 인정받아 관련 저널에 게재 되었다.

기존 KorPatBERT 사용 협약체결 기관·기업(35곳)을 대상으로 실시한 설문조사 결과를 바탕으로 보급절차를 간소화하였으며, 글로벌 오픈소스 공유 플랫폼인 깃허브를 통해 공개하여 관심 있는 기관·기업, 연구자 누구나 KorPatELECTRA를 이용할 수 있도록 하였다. 또한 9월 1일(목)부터 개최되는 국제특허정보박람회(PATINEX)에서 신규 언어모델과 IP분야 디지털 혁신사례 및 활용 전략 등을 공개할 예정이다.

한편 정보원은 AI 언어모델 개발에 그치지 않고, 이를 활용한 고품질의 특허분류 추천, 유사특허검색 시스템을 구현하였으며, 현재는 특정 언어에 구애받지 않고 시스템을 활용할 수 있도록 다국어 처리 기술에 대한 실증을 진행 중이다.

강경호 원장은 “한국특허정보원의 특수법인 출범(8. 4)과 정부「디지털플랫폼정부」정책에 발맞춰 IP분야 지능정보화 혁신을 위한 AI 모델 보급 및 기술이전을 지속적으로 추진하고, 민·관이 함께 성장하는 혁신 생태계를 조성하여 지식재산 기반 기술강국으로 발돋음 하는데 중추적인 역할을 수행해 나갈 예정이다.”라고 밝혔다.

기사 URL이 복사되었습니다.

세상을 보는 균형, 한국일보Copyright ⓒ Hankookilbo 신문 구독신청

LIVE ISSUE

기사 URL이 복사되었습니다.

댓글0

0 / 250
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.