“빅데이터도 결국 데이터일 뿐입니다. 데이터는 과거 사실에 대한 기록과 현상 분석을 위한 기초 자료에 불과합니다. 그렇기 때문에 빅데이터로 미래를 예측한다는 건 과장이라고 할 수 있습니다.”
김동환(53) 중앙대 공공인재학부 교수가 빅데이터에 대한 과도한 기대에 일침을 가했다. 최근 ‘빅데이터는 거품이다’(페이퍼로드)를 펴낸 김 교수는 한국일보와 인터뷰에서 “2011년부터 불기 시작한 빅데이터 열풍이 실체가 없는 채로 계속 이어지면서 거품이 커지고 있다”며 “빅데이터가 정부 정책의 핵심으로 자리 잡는 것을 보면서 누군가는 비판해야 하지 않나 하는 생각에 책을 쓰게 됐다”고 말했다.
행정학 전공인 김 교수는 대학원 과정 중 통계 프로그램을 만든 적이 있고 1980년대 후반부터 인공지능과 신경망 이론을 연구했다. 전공 분야인 시스템 다이내믹스(사회나 조직 시스템 등과 같은 복잡한 피드백 시스템을 연구하고 관리하는 방법론)도 계량적인 접근을 바탕으로 한다. 데이터 분석에서는 전문가 못지않은 식견을 갖추고 있다.
김 교수는 2011년 11월 7일이 “우리나라 빅데이터의 생일”이라고 했다. 이날 이명박 당시 대통령이 참석한 제3차 국가정보화전략위원회 보고회의에서 이각범 위원장이 빅데이터를 가장 주목해야 할 개념으로 제시했고 이 대통령도 빅데이터라는 화두를 조속히 실천에 옮기도록 지시했다. 이를 시작으로 빅데이터는 국가사업과 정책의 곳곳에 스며들었고 이명박ㆍ박근혜 정부는 빅데이터 분석을 통해 국가 현안에 선제적으로 대응하고 미래 전략을 세우겠다면서 대규모 예산을 투입하겠다고 밝혔다. 김포시는 한술 더 떠 민간기업과 함께 주식회사 김포빅데이터를 설립했다. 빅데이터를 통한 안전도시를 조성하고 이 기술을 수출하겠다는 것이다.
김 교수는 빅데이터를 활용해 미래를 예측할 수 있을 것이라 믿는 정부와 지방자치단체의 관련 정책 추진에 우려를 표한다. 범죄 발생 장소 및 시간 예측을 통해 범죄 발생을 최소화한다거나 예측 기반의 자연재해를 조기 감지해 대응하는 것이 현재로선 사실상 불가능하다는 것이다. 그는 “빅데이터에는 신용카드 사용 정보처럼 규격화된 정형 데이터 이상으로 폐쇄회로(CC)TV 영상이나 소셜미디어(SNS)에서 유통되는 메시지와 사진처럼 비정형 데이터도 중요한데 이를 분석할 만한 기술은 아직 요원하다”며 “비정형 데이터를 제대로 분석하지도 못하면서 그것을 토대로 의미 있는 정책을 낼 순 없을 것”이라고 말했다. “미래 예측에 활용하겠다는 일부 데이터는 크기가 너무 작아 빅데이터라고 하기도 어렵다”는 점도 지적했다.
김 교수가 비판하는 것은 빅데이터를 미래 예측의 수단으로 과신하는 것이지, 과거나 현재의 현상 분석의 도구로 활용하는 것까지 비판하는 것은 아니다. 그는 “정부나 지자체의 빅데이터 관련 프로젝트가 모두 잘못된 것은 아니다”라면서 “서울시가 KT 휴대전화 사용자의 빅데이터를 활용해 심야버스 노선을 만든 것과 보건복지부가 10개 기관에서 수집한 정보를 빅데이터로 분석해서 사각지대에 놓인 복지대상자 1만 8,000여명을 찾아낸 것은 빅데이터를 올바로 사용한 모범 사례”라고 평가했다.
김 교수는 앞으로 사물인터넷(IoT)을 통해 쏟아져 나오게 될 방대한 양의 빅데이터를 활용하는 데 관심을 기울여야 한다고 강조했다. 물질세계와 정보의 조합인 사물인터넷에서 쏟아져 나오는 정형 데이터를 잘 분석해 현실에 도움을 줄 수 있는 좋은 서비스를 만들어내는 것에 초점을 맞춰야 한다는 것이다. 그는 빅데이터만큼이나 ‘스몰데이터’가 중요하다는 점도 역설했다. “빅데이터는 방대한 데이터를 통계화해 현상과 현상 사이의 상관관계를 찾지만 스몰데이터는 원인과 결과의 인과관계를 파악하도록 합니다. 사업가나 행정가에게는 상관관계보다 인과관계가 더 중요하니까요. 크든 작든 데이터의 본질에 충실한 것이 가장 중요합니다.”
고경석 기자 kave@hankookilbo.com
기사 URL이 복사되었습니다.
댓글0