장인철의 버추얼 호라이즌

‘AI 환각’ 최소화에 도전하는 ‘솔라’의 기술

입력: 2024.03.20 17:00
수정: 2024.03.20 20:46

24면

0 0

‘솔라’는 위 개념도의 광학문자인식 단계부터 벡터데이터베이스에 이르는 정보처리과정에 ‘AI 환각’을 최소화하는 독자기술들을 적용해 기능적 완성도를 높인 것으로 평가된다.

확률적으로 단어를 생성하는 거대언어모델(LLM) 인공지능(AI) 특성상 AI가 가끔 엉뚱한 답을 생성하는 ‘AI환각(할루시네이션)’은 고질적인 문제다. 이 문제 해결을 위해 업스테이지는 ‘검색증강생성(RAGㆍRetrieval Augmented Generation)’이라는 기술을 적극 적용한다. 정확한 답변을 위해 필요한 레퍼런스를 제공함으로써 LLM의 환각 가능성을 최소화하는 방식이다.

예를 들어, 사용자가 "친구들과 함께 볼 수 있는 좋은 영화를 추천해 주세요. 1980년대 후반의 공포 영화를 좋아해요"라는 질문을 했다 치자. LLM이 영화 관련 데이터에 대한 훈련이 돼 있지 않은 경우, 환각 문제가 발생할 가능성이 높다. LLM의 핵심 기능작동 방식이 다음 단어 예측에 의존해 가장 그럴듯한 단어를 선택하는 방식이기 때문에 실제 그런 영화가 존재하지도 않음에도 “그럼요! 1980년대 유명 여배우가 출연한 '숲속의 비명'은 어때요?”라는 답을 내놓는 식이다.

이를 해결할 RAG의 첫 번째 단계는 자체 데이터를 ‘임베딩 모델(embedding model)’에 통합하는 것이다. 임베딩이란 쉽게 말해서 영화 질문의 경우, 자체 영화 관련 정보를 벡터화해 ‘벡터 데이터베이스’를 구축하는 방식이다. 영화 관련 벡터화 정보가 풍부해진 이 데이터베이스는 ‘검색ㆍ추출(Retriever)’ 부분에서 사용자의 쿼리와 관련된 올바른 정보를 찾는 데 도움을 준다.

‘답변검증(Answer Verification)'은 사용자에게 최종적으로 답변이 전달되기 전에 답변이 레퍼런스와 잘 맞는지 검증함으로써 제공된 정보의 정확성을 보장한다. 답변이 적절치 않을 경우엔 오답을 LLM으로 반송(Retry)해 수정할 기회를 제공한다. 요컨대 RAG는 데이터로 답변의 근거를 마련하고, 답변 검증을 통해 정확도를 확인하는 방식이다.

장인철 수석논설위원 icjang@hankookilbo.com

당신이 관심 있을 만한 이슈

흰색 배경
검은색 배경

0 / 250

좋아요순 최신순 새로고침

한국일보에
로그인하면 다양한
편의 기능을
제공 받을 수 있습니다.

내 관심사대로 메인뉴스 설정
구독한 콘텐츠 모아보기 제공
주요기사와 추천, 활동내역 알림

아이디 또는 비밀번호를 잘못 입력했습니다.(연속 1회)
아래 이미지를 보이는 대로 입력해주세요.

스피커로 들리는 내용을 숫자로 입력해 주세요.
- 새로고침
- 음성으로 듣기
- 새로고침
- 이미지로 보기
로그인 유지

전체동의 (선택포함)

한국일보 이용약관 (필수)

내용보기

개인정보처리 방침 (필수)

내용보기

이벤트/프로모션 등 정보 수신 동의 (선택)

이메일
SMS

한국일보가 제공하는 다양한 형태의 이벤트 및 행사(포럼, 대회, 강연, 시상, 수상, 구독 등) 관련한 참여 정보를 추천·안내

이용약관 및 개인정보 처리 방침은 필수 항목 입니다.

선택 항목 미동의 시 뉴스 추천서비스 혹은 이벤트/행사 당첨 혜택에서 제외될 수 있습니다.

‘AI 환각’ 최소화에 도전하는 ‘솔라’의 기술

당신이 관심 있을 만한 이슈

LIVE ISSUE

댓글0

‘AI 환각’ 최소화에 도전하는 ‘솔라’의 기술

이 기사와 관련된 기사

당신이 관심 있을 만한 이슈

포커스 취재 많이 본 뉴스

LIVE ISSUE

댓글0

‘AI 환각’ 최소화에 도전하는 ‘솔라’의 기술

보내는 분