텍스트·이미지·영상 등 다양한 뉴스데이터를 dAIa 기술로 정교하게 품질 극대화
다하미커뮤니케이션즈(이하 다하미)는 AI 학습을 위한 뉴스 데이터 공급 서비스인 NDPT(News data for Pre-Training)를 출시했다고 5일 밝혔다.
‘NDPT’는 고품질의 인공지능 학습용 뉴스 데이터 제공 서비스로 25년간 국내 저작권 유통 사업으로 확보한 지면뉴스에서 온라인, 방송 뉴스, 보도사진까지 저작권이 해결된 안전한 데이터를 제공한다는 설명이다.
또한, AI빅테크 기업에서 필요로 하는 대형 언어모델(LLM) 및 대형 다중유형 모델(LMM) 구축에 자사의 기술이 접목된 학습용 데이터인 ‘NDPT’를 사용하면 AI 학습에 최고의 결과를 얻을 수 있을 것이라고 다하미 관계자는 말했다.
이번에 출시한 ‘NDPT’ 서비스는 국내 최대의 뉴스 데이터를 텍스트, 이미지, 영상 등 다양한 형태로 보유하고 있다. 여기에 163만 건(하루 평균 200여개)의 정부부처 보도자료까지 확보하고 있어 다양하고 신뢰성 있는 데이터 학습으로 최적의 품질과 데이터 유용성을 보장한다.
뉴스는 정치, 경제, 사회, 문화 등 다양한 주제의 정보를 다루며 지속적으로 발생하기 때문에 AI가 최신 정보를 학습하고 실시간으로 변화하는 상황을 이해하는데 적합하지만, 데이터가 정확하지 않은 경우 학습이 제대로 진행되지 않을 수 있어 양질의 신뢰성 있는 데이터 확보가 관건이다.
‘NDPT’는 정확하고 신뢰성 높은 AI 학습 데이터를 제공하기 위해 자사의 특화된 AI 프레임워크인 ‘dAIa(Dahami Artificial Intelligence Application)’를 적극 활용한다. 이 프레임워크는 국내 뉴스 데이터를 세밀하게 정제하고 검수하는 과정을 거쳐, 데이터의 품질을 극대화한다.
다하미에서 출시한 ‘NDPT’ 서비스는 데이터 제공 범위 및 가격 등이 구체적으로 정해지지 않은 시장 환경에서 많은 언론사와 개별적으로 계약하는 번거로움을 줄이고 국내 언론사와의 저작권 계약을 한 번에 해결 가능하도록 설계된 서비스이다.
2008년 이래 한국언론진흥재단의 공식 유통사로 국내 최대 뉴스 유통 전문업체인 다하미는 지면, 온라인, 방송뉴스를 스크랩하고 보고서로 완성하는 ‘스크랩마스터’를 세계 최초로 개발했으며, 피알꼭(보도자료 집계 시스템) 등 뉴스 콘텐츠 솔루션을 접목시킨 기술에 대해 개발, 적용시키는 연구를 계속 진행 중이다.
또한, 2016년부터 매년 고용노동부에서 선정하는 ‘청년친화강소기업’에 (청년들이 선호하는 근로여건을 갖춘 기업) 2024년에도 선정, 9년째 자격을 유지 중이다.
기사 URL이 복사되었습니다.
댓글0