한국은행 'BOK 이슈노트'
"텍스트 분석, 경기 예측에 효과적"
증권사 보고서의 숫자 정보뿐 아니라 정성적 정보(텍스트)도 인공지능(AI) 기술을 통해 가공하면 향후 산업 전망과 거시지표 예측 등에 도움이 된다는 분석 결과가 나왔다.
서범석 한국은행 거시모형팀 과장은 16일 ‘AI 알고리즘을 이용한 산업 모니터링: 증권사 리포트 텍스트 분석’ 보고서에서 이같이 밝혔다. 서 과장은 52개 증권사의 애널리스트 1,079명이 2019~2022년 작성한 기업 분석 보고서 12만8,000건을 빅데이터로 수집해 정성적 정보만 추려 자연어처리(NLP) 기법으로 분석했다. NLP 기술은 컴퓨터가 인간의 언어를 머신러닝을 통해 이해하고 해석, 처리할 수 있도록 하는 AI의 핵심 분야다.
서 과장은 먼저 리포트 문장의 논조를 긍・부정과 중립으로 분류한 뒤 이를 수치화해 ‘텍스트 기반 업황 지수’를 산출했다. 이렇게 만들어진 업종별 텍스트 업황은 코스피 산업별 지수와 상관계수가 0.5~0.9 수준으로 매우 높게 나타났다. 상관계수는 -1부터 1 사이의 값을 가지는데 1에 가까울수록 강한 상관관계를 의미한다.
특히 전 산업을 대상으로 추정한 텍스트 업황은 국내총생산(GDP), 기업경기실사지수(BSI) 등 거시경제 지표에 대해 뚜렷한 선행성을 보였다. 이들 지표 예측에 유용하게 활용할 수 있다는 뜻이다. 증권가 코스피 컨센서스 전망치에는 나타나지 않는 경기선행지수 순환변동치와의 인과관계도 확인됐다. 서 과장은 “애널리스트들이 제시하는 텍스트 정보에 숫자가 전달하지 못하는 새로운 정보가 반영되고 있을 가능성을 시사한다”고 해석했다.
이외에 텍스트 분석은 △기업 경영환경 변화 △환율 등 특정 경제 이슈에 대한 영향도 평가 △산업 간 유사도 지표 △지역별 기업 업황지수 등 다양한 연구에 활용할 수 있다. 서 과장은 “텍스트를 이용해 더 깊이 있는 경제 분석을 하려면 경제이론 등 배경지식과 연결해 분석할 필요가 있다”면서 “이를 위해 GPT 등과 같은 거대 통계 모형의 구축이 필요할 것”이라고 했다.
기사 URL이 복사되었습니다.
댓글0