읽는 재미의 발견

새로워진 한국일보로그인/회원가입

  • 관심과 취향에 맞게 내맘대로 메인 뉴스 설정
  • 구독한 콘텐츠는 마이페이지에서 한번에 모아보기
  • 속보, 단독은 물론 관심기사와 활동내역까지 알림
자세히보기 닫기

알림

"벚꽃일 확률이 97% 입니다"… 예쁜 꽃, 이름이 궁금하다면?

입력
2021.03.27 09:00
13면
0 0

편집자주

현실로 성큼 다가온 인공지능(AI)시대. 생활 속에 깊숙이 스며든 AI 이야기가 격주 토요일 <한국일보> 에 찾아옵니다. 컴퓨터비전을 연구하는 정소영 서울여대 기초교육원 초빙교수가 쉽게 풀어드립니다.

꽃샘추위가 물러가고 봄 기운이 완연한 지난 24일 오후 서울 송파구 석촌호수 둘레길에 벚꽃이 피어 있다. 뉴스1

꽃샘추위가 물러가고 봄 기운이 완연한 지난 24일 오후 서울 송파구 석촌호수 둘레길에 벚꽃이 피어 있다. 뉴스1

꽃샘추위가 지나가자 봄기운이 만연하다. 앙상했던 나뭇가지에는 파릇한 싹이 움트고 봄의 시작을 알리는 진달래와 개나리가 길가에 즐비하다. ‘벚꽃이 벌써 피었나?’ 흰 꽃이 새하얀 눈처럼 덮인 나무에 시선이 꽂힌다. 우스갯소리로 벚꽃의 꽃말은 중간고사라는 말이 있다. 중간고사 기간인 4월 중순 즈음 꽃이 피기 때문이다. 아직 벚꽃이 필 시기가 아니지만 저 앞에 보이는 나무에 피는 하얗고 작은 꽃이 영락없이 벚꽃 같아 보인다. 다음 앱에서 꽃 검색버튼을 눌러본다. ‘꽃의 정면을 크게 촬영해 주세요.’라는 가이드에 맞춰 벚꽃으로 추정되는 꽃을 찍어본다. ‘이 꽃은 매화나무일 확률이 97%입니다.’ 매화가 이렇게 벚꽃과 닮았구나. 꽃 검색 기능은 비슷하게 생긴 꽃도 97%의 확률로 정확하게 찾아냈다.

날이 따뜻해질수록 형형색색의 예쁜 꽃들이 피어날 것이다. 매년 봄마다 보았지만 이름을 모르는 꽃도 있고, 생전 처음 보지만 너무 아름다워 이름을 알고 싶은 꽃도 있다. 꽃이 많이 피는 계절, 꽃의 이름을 알고 싶을 때가 많지만 꽃 검색 기능이 없던 시절에는 이를 찾아낼 방법이 요원했다. 검색을 하고 싶어도 검색어를 뭐라고 적어야 검색이 가능한지 알 수 없었기 때문이다. 하지만 이제는 꽃을 사진으로 찍어 쉽게 검색할 수 있다. AI를 이용한 이미지 검색이 가능해진 탓이다. 특히 사용자가 직접 찍은 사진을 분석하는 것은 전통적인 컴퓨터비전 알고리즘만으로는 매우 어려운 일이었는데, 피사체가 어느 위치에 찍히는지, 배경에 다른 물체가 함께 찍히지는 않았는지에 따라 정확도의 차이가 많이 났기 때문이다. 하지만 딥러닝을 이용한 AI 이미지 분석이 가능해진 이 시점에선 사진만으로 검색하는 이미지 분석이 충분히 가능해졌다

이미지 검색은 사진 속 피사체가 무엇인지 검색해 주는 알고리즘이다. 꽃 검색을 예로 들면 사진 속 꽃이 어떤 특징을 가진 꽃인지 영상을 분석해 해당 특징과 동일한 특징을 가진 품종으로 분류 및 검색해주는 기능이다. 이미지 분석에는 딥러닝이 이용되는데, 우리가 꽃을 구분할 때 꽃이 무슨 색인지, 꽃잎은 몇 장인지 생김새의 특징을 파악한 후 구분하는 것처럼 딥러닝 모델 또한 영상 속 피사체의 특징을 분석하게 된다. 이미지 분석에는 CNN(Convolution Neural Network) 기반의 딥러닝 모델이 주로 사용된다. CNN은 특징을 찾아내는 필터가 이미지 전체 영역을 이동하며 특징을 추출해 이미지 내 다양한 패턴을 학습하기 때문에 동일한 특징이 이미지 내 여러 지역에 존재하더라도 그 특징을 잘 분석할 수 있다는 장점이 있다. 이 때문인지 다음 앱의 꽃 검색기능에 ‘꽃의 정면을 크게 촬영하라'는 가이드가 있지만, 경험상 꽃이 크게 찍히지 않더라도 상당히 잘 검색됐다.

특히 개나리나 진달래 등 주변에서 흔하게 접할 수 있는 꽃은 대충 찍어도 높은 정확도로 꽃이 잘 검색이 되었는데, 아마도 딥러닝 학습의 특성상 학습할 데이터가 많을수록 더 정확하게 학습이 되기 때문에 우리나라에서 흔히 볼 수 있는 꽃은 필연적으로 더 많은 영상으로 학습이 될 수 있었고, 그래서 더 정확히 검색되었을 확률이 높다. 이는 반대로 국내에 자생하지 않거나 흔하지 않은 꽃들은 정확한 분류가 어려울 수 있음을 암시한다.

이런 데이터의 불균형 문제를 잘 해결하는 것 또한 이미지 검색이 더 발전하기 위해 넘어야 할 하나의 과제이다. 이미지 검색의 성패는 얼마나 다양한 종류의 고품질 데이터로 학습을 시키는지에 달려 있다고 볼 수도 있다. 이번 봄에는 더 많은 꽃들이 이름 모를 꽃이 아닌 자신의 이름으로 불릴 수 있도록 많은 사진을 찍어보는 것은 어떨까.

정소영 서울여대 기초교육원 초빙교수

기사 URL이 복사되었습니다.

세상을 보는 균형, 한국일보Copyright ⓒ Hankookilbo 신문 구독신청

LIVE ISSUE

댓글0

0 / 250
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.