미국 캘리포니아주 샌터크루즈 경찰청은 범죄가 발생할 장소와 시간을 예측해 매일 시민들에게 알려준다. 조지 몰러 UC샌터크루즈 교수 등이 여진(餘震) 예측 방정식을 이용해 만든 프로그램이다. 여진처럼 범죄도 모방 가능성이 높다는데 착안했다. 도입 후 범죄 발생률이 27% 감소했다. 뉴욕시는 최근 3,000대의 CCTV와 수천 개의 차량 인식기, 경찰 데이터베이스를 연계해 만든 최첨단 범죄감시시스템을 공개했다. 2054년 미국 워싱턴을 무대로 미래의 범죄를 예측하는 내용의 영화 가 일찌감치 현실화한 셈이다.
■ 엄청나게 쌓이는 정보, 이른바 '빅 데이터(Big Data)'가 범죄 예방에 활용된 사례들이다. 우리는 알게 모르게 수많은 데이터를 남긴다. 출퇴근길 버스나 지하철카드를 통해 동선이 남겨진다. 하루에도 수십 번 CCTV에 찍힌다. 휴대전화와 SNS, 메신저도 일일이 기록된다. 신용카드를 긁을 때마다 정보가 저장된다. 지난해 전 세계에서 생성된 디지털 정보량은 1.8제타바이트(ZBㆍ1,000조MB)다. 우리 국민 모두가 트위터에 18만년 동안 1분마다 3개의 글을 올려야 하는 양이다. 막대한 데이터 더미에서 숨겨진 패턴을 추출하고 이를 기반으로 미래를 예측하는 게 빅 데이터의 요체다.
■ 빅 데이터는 범죄 예방뿐 아니라 정치, 경제, 문화 등 다양한 분야에서 활용된다. 미국과 아일랜드에서 SNS를 분석했더니 '우울하다' '열 받는다' '불안하다'는 대화가 늘어난 수개월 뒤 실업률이 높아졌다. 미국 인디애나대 연구진은 10개월치 1,000만개의 트윗을 분석해 주가추이를 분석했다. 트위터에서 부정적으로 거론되는 빈도가 늘어나는 기업의 주가가 떨어질 거라는 가정에서 시작된 분석의 정확도는 88%나 됐다.
■ 각국 정부와 기업들은 빅 데이터 시장을 선점하기 위해 열띤 경쟁을 벌이고 있다. 미국은 연 2억 달러를 투자하는 정책을 지난 3월 발표했다. 일본도 총무성 산하 기관에서 활용방안을 모색 중이다. 우리는 지난 주에야 정부와 민간단체 공동으로 '빅 데이터 포럼'을 결성했다. 정체상태인 IT산업의 돌파구를 빅 데이터에서 찾아볼만하다.
이충재 논설위원 cjlee@hk.co.kr
기사 URL이 복사되었습니다.
댓글0