읽는 재미의 발견

새로워진 한국일보로그인/회원가입

  • 관심과 취향에 맞게 내맘대로 메인 뉴스 설정
  • 구독한 콘텐츠는 마이페이지에서 한번에 모아보기
  • 속보, 단독은 물론 관심기사와 활동내역까지 알림
자세히보기
“바둑 → 스타크래프트 → 리니지… AI가 현실세계와 가까워지는 과정”
알림

“바둑 → 스타크래프트 → 리니지… AI가 현실세계와 가까워지는 과정”

입력
2019.03.27 18:29
수정
2019.03.27 21:26
21면
0 0

‘스타2’ 프로게이머 출신 오인석 엔씨소프트 연구원 인터뷰

스타크래프트2 프로구단 '슬레이어즈'의 '밀즈'로 활동했던 오인석 연구원은 현재 엔씨소프트의 AI센터에서 강화학습 AI를 연구하고 있다. 이한호 기자
스타크래프트2 프로구단 '슬레이어즈'의 '밀즈'로 활동했던 오인석 연구원은 현재 엔씨소프트의 AI센터에서 강화학습 AI를 연구하고 있다. 이한호 기자

인공지능(AI) 바둑 프로그램 ‘알파고’를 개발했던 구글 딥마인드는 1월 24일 자체 개발한 스타크래프트2 게이머 ‘알파스타’가 현역 프로게이머 2명을 상대로 11전 10승을 거뒀다고 발표했다. 2016년 ‘알파고 쇼크’ 이후 불과 3년 만에 이뤄낸 성과였다.

“경기 내용을 보고 솔직히 놀랐습니다. 알파스타와 직접 경기해 보고 싶다는 생각도 들었죠.” 오인석(30) 엔씨소프트 연구원에게 알파스타의 경기는 남달랐다. 그는 2011년 스타크래프트2 프로구단 ‘슬레이어즈’에서 ‘밀즈(Milz)’라는 이름으로 활동했던 ‘진짜’ 프로게이머 출신이다. 세종대 컴퓨터공학과 인지지능(CI)랩에서 석사학위를 받은 뒤 현재 엔씨소프트 게임AI랩 강화학습팀에서 AI를 연구하고 있다. 엔씨소프트는 현재 딥마인드를 제외하면 게임 AI 개발에 가장 앞서나간 곳 중 하나다.

지난해 12월 알파스타가 ‘TLO’ 다리오 뷘시 선수와 경기하는 모습. 다만 사람과 달리 시야각을 제한하지 않은 '어드밴티지'가 주어졌다. 딥마인드 웹페이지 캡처
지난해 12월 알파스타가 ‘TLO’ 다리오 뷘시 선수와 경기하는 모습. 다만 사람과 달리 시야각을 제한하지 않은 '어드밴티지'가 주어졌다. 딥마인드 웹페이지 캡처

그가 보는 알파스타의 발전 속도는 상상 이상이다. 지난해 상반기만 해도 스타크래프트2 AI를 연구하던 중국 텐센트나 학계 수준은 일반 사람 중 상위 30~50% 수준에 불과했는데, 불과 몇 개월 만에 알파스타가 ‘꽤 잘하는’ 프로게이머(상위 3% 이내)를 이길 수 있는 수준으로 뛰어올랐기 때문이다. 게다가 AI 모델 완성 후 AI 간 모의경기 등 훈련에는 고작 2주가 소요됐을 뿐이었다. 오 연구원은 “알파스타는 사람이 전혀 안 쓰는 신기한 전략ㆍ전술을 사용했다”면서 “강화학습을 통해 성장하면서 사람의 실제 게임 방식과는 전혀 다르게 접근하는 ‘창의성’을 보여 준 것”이라고 말했다. 편향과 선호를 가지고 게임을 하는 사람과 달리 AI는 모든 경우의 수를 고려해 전략과 전술을 짜기 때문에 가능한 일이다.

물론 아직 약점은 있다. 알파스타가 진 경기가 다름아닌 사람 수준으로 시야를 제한한 결과였는데, 정보가 완전히 공개되지 않은 상황에서는 AI 특기인 경우의 수 계산이 어려워졌기 때문이다. 오 연구원은 “정찰을 통해 정보를 습득해가면서, 그리고 상대 선수의 특징을 고려해서 전략을 짜야 사람 수준 AI라고 할 수 있을 것”이라고 설명했다.

알파스타가 '마나(MaNa)' 그레고리 코민츠 선수와 경기하는 과정을 시각화한 그림. 관찰을 통해 신경망이 활성화되는 과정, 그 뒤 선택할 수 있는 액션의 종류와 실제 선택한 결과를 보여준다. 딥마인드 웹페이지 캡처
알파스타가 '마나(MaNa)' 그레고리 코민츠 선수와 경기하는 과정을 시각화한 그림. 관찰을 통해 신경망이 활성화되는 과정, 그 뒤 선택할 수 있는 액션의 종류와 실제 선택한 결과를 보여준다. 딥마인드 웹페이지 캡처

오 연구원은 구글과 엔씨소프트를 포함한 AI 연구 기업들이 게임에 도전하는 이유에 대해 ‘게임이 AI 모델을 만들고 실험하기에 가장 최적화된 도구이기 때문’이라고 설명했다. “게임 공간은 심혈을 기울여 잘 만들어놓은 가상현실”이기도 하면서 “체스에서 바둑, 바둑에서 스타크래프트로 가는 길은 점점 현실에 가까워지는 과정”이기 때문이다.

알파고의 다음 행보가 알파스타인 것도 이유가 있다. 스타크래프트가 세계에서 가장 유명한 실시간 전략 시뮬레이션(RTS) 게임이라는 점, 모든 정보가 공개된 상태에서 서로 번갈아 가며 움직이는 턴제 게임과 달리 유닛의 시야 안에서만 정보를 얻을 수 있는 스타크래프트는 모든 상황마다 수백, 수천 가지 선택이 맞물려 돌아가고 매 순간 경우의 수는 셀 수 없을 정도라는 점 때문이다. 오 연구원은 “바둑은 19×19 가지로 경우의 수가 한정돼 있지만, 스타크래프트는 바둑에 비해 유닛과 명령, 포지션의 종류가 너무 다양하다”며 “또 60초의 시간이 주어지는 바둑과 달리 바로 반응하지 않으면 손해를 보기 때문에, AI 입장에서도 RTS 게임은 바둑보다 훨씬 극복하기 어려운 대상”이라고 말했다.

그렇다면 AI가 스타크래프트마저 극복하면 다음 도전의 대상은 무엇일까? 오 연구원은 “역할수행게임(RPG)”이라고 추측했다. 리니지와 같은 MMORPG의 경우 △무한대로 넓은 공간 △수십에서 수백만 이용자들과의 상호작용 △다양한 아이템 △복잡한 기술과 선택지 등 통제되지 않는 변수가 많아 ‘현실의 축소판’이라 볼 수 있다. 그는 “하나의 게임을 잘 해내는 AI를 여러 종류 모으면 더 높은 단계 게임을 할 수 있게 되고, 이런 단계를 이어가다 보면 궁극적으로는 사람처럼 행동하거나 생각하는 AI까지 만들 수 있게 될 것”이라고 말했다. 공격 전략을 짜는 AI, 동료 유저들과 협업하는 AI 등 다양한 AI를 만들어 합쳐야 더욱 고차원적인 게임 AI를 만들 수 있게 된다는 것이다. 현재 AI는 아직 사람과의 격차가 상당하다는 뜻이기도 하다.

프로게이머 출신 오인석 엔씨소프트 AI센터 강화학습팀 연구원이 한국일보와의 인터뷰에서 게임 AI에 대해 설명하고 있다. 이한호 기자
프로게이머 출신 오인석 엔씨소프트 AI센터 강화학습팀 연구원이 한국일보와의 인터뷰에서 게임 AI에 대해 설명하고 있다. 이한호 기자

오 연구원이 일하는 엔씨소프트는 AI센터에만 150여명 직원이 근무하고 있을 정도로 AI 개발에 가장 많은 투자를 하고 있는 기업 중 하나다. 이달 19일(현지시간)에는 미국 샌프란시스코 세계 최대 게임 개발자 콘퍼런스 GDC에서 자사 지식재산권(IP) 게임 ‘블레이드앤소울’의 ‘비무AI’를 발표했다. 비무AI에는 알파스타와 같은 강화학습 기술이 적용돼 1주일이면 프로게이머 수준까지 성장할 수 있다. 상용 게임에서 이 정도 수준의 AI를 만든 것은 알파스타를 제외하고는 처음이다. 국내 AI 기술 수준을 증명한 셈이다.

김택진 엔씨소프트 대표 역시 지원을 아끼지 않는다. AI 연구개발(R&D)에 대해 “될 때까지 하겠다”며 의지를 불태운 것으로 알려졌다. 오 연구원은 “알파스타가 진보된 기술을 선보였지만, 엔씨소프트도 충분히 따라갈 수 있을 만한 수준이라고 본다”면서 “게임 AI를 넘어 다양한 AI 영역에 도전해 나갈 것”이라고 말했다.

곽주현 기자 zooh@hankookilbo.com

기사 URL이 복사되었습니다.

세상을 보는 균형, 한국일보Copyright ⓒ Hankookilbo 신문 구독신청

LIVE ISSUE

기사 URL이 복사되었습니다.

댓글0

0 / 250
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.