“캠핑 장비를 구입한 후 경품 추천 이벤트에 응모했습니까.”
“ 베이비샤워(Baby shower·출산 전 축하행사) 파티 사진을 페이스북에 올렸습니까.”
“새로 이사한 집의 인테리어를 위해 디자인용품 숍의 페이스북 페이지에 댓글을 달았습니까.”
이 질문에 모두 ‘예’라고 답했다면 며칠 뒤 e메일함엔 ‘가족여행 추천 정보지’ ‘아기 방 인테리어 정보 사이트’ ‘가족을 위한 생명보험 안내 정보’가 날아올 가능성이 크다. 이미 당신의 연령·성별·거주지·전화번호· e메일 주소·경제력 등 상당한 개인정보가 ‘데이터 브로커(Data Broker)’를 통해 여행사·보험사·인테리어업체로 넘겨졌을 것이기 때문이다.
예전 같았으면 버려졌을 사소한 데이터이지만 이런 걸 분석하는 기술이 발전하면서 데이터 하나하나가 ‘돈이 되는’ 정보로 탈바꿈하고 있다. 거대한 데이터 꾸러미인 빅데이터가 정보기술(IT) 산업의 금맥으로 각광받는 이유다.
델레스 크리쉬난 IBM 아시아·태평양 지역 마케팅 총괄은 “지금도 하루에 한 사람이 스마트폰을 만지는 횟수가 150번이고, 매일 인터넷에서 소셜네트워크서비스(SNS) 활동이 20억 회 이상 일어나고 있다”며 “이렇게 만들어지는 빅데이터를 이해하지 못하면 사회를, 시장을 이해할 수 없는 시대가 됐다”고 말했다.
빅데이터가 뜨자 데이터 브로커들도 전성기를 맞았다. 데이터 브로커란 소비자의 개인정보를 수집해서 이 정보를 제3자와 공유하거나 재판매하는 기업을 가리킨다.
가장 유명한 데이터 브로커는 미국 액시엄(Axiom)이다. 액시엄은 전 세계 7억 명 이상의 소비자 정보를 보유하고 있다. 보유한 정보는 1인당 1500개 항목에 달할 정도로 방대하다. 미국 연방·지방 정부, 포춘 100대 기업들이 액시엄에서 정보를 사서 업무에 활용한다. 2001년 9월 11일 전 세계를 뒤흔든 미국 9·11 테러범도 액시엄이 수집해놓은 데이터를 활용해 잡아냈다.
워싱턴 정가에서도 갤럽의 여론조사보다 데이터 브로커들이 제공하는 빅데이터의 영향력이 더 커진 지 오래다. 버락 오바마 미국 대통령도 대선에서 액시엄이 제공한 데이터를 활용했다. 또 다른 데이터 브로커 코어로직(Corelogic)은 8억 건의 부동산 거래정보와 1억 건의 담보 데이터를 미국 산업계와 미 정부에 제공하고 있다.
14억 명의 사용자 빅데이터를 보유한 페이스북도 데이터 브로커 업체들의 고객이다. 페이스북은 2012년 데이터로직스(Datalogix)라는 데이터 브로커 업체와 협력 사실을 밝히고 사용자들이 상품 광고를 보는 것이 실제 구매로 얼마나 이어지는지를 살폈다. 정보통신정책연구원에 따르면 미국 상위 9개 데이터 브로커 기업들의 매출은 2012년 기준 4억2600만 달러에 이른다.
개인정보 거래가 불법인 국내에는 아직 데이터 브로커가 없다. 다만 빅데이터에 대한 관심이 높아지면서 의미 있는 빅데이터를 생산·활용하려는 움직임이 점차 늘고 있다. 대표적인 예가 콜센터 서비스다. 요즘 신용카드사와 보험업계에서는 콜센터에 전화를 건 소비자의 목소리를 문자(텍스트)로 바꿔주는 STT(Speech-To-Text) 기술이 빠르게 확산되고 있다. 예전에도 소비자 목소리를 녹음하기는 했지만 소비자와 분쟁이 생길 경우를 제외하고는 이 녹음파일을 활용하는 경우는 드물었다. 하지만 STT로 대화 내용이 문자로 바뀌니 분석하기 좋은 빅데이터로 바뀌었다. 소비자가 자주 사용하는 단어나 말투, 억양 변화 등을 분석하면 신용카드·보험 해지 시점까지도 미리 예측할 수 있다. 예를 들어 ‘취소’ ‘해지’ ‘안돼’ ‘그렇지만’ 등의 단어가 많으면 곧 해지 가능성이 높으니 미리 전화를 걸어 맞춤형 대응을 하는 식이다.
공공 분야에서도 빅데이터를 적극 활용하고 있다. 공공 데이터 개방에 적극적인 서울시는 빅데이터를 활용해 주차 문제, 교통사고, 마을버스 노선과 같은 생활 밀착형 공공서비스를 개선하겠다고 밝혔다. 심야시간에 특정 노선을 중심으로 운영된 심야 올빼미 버스도 서울시와 KT가 공공데이터로 만든 서비스다. 스타트업 ‘모두의주차장’은 서울 지역 구청들과 협력해 거주자우선주차구역의 실시간 주차 정보를 분석해 주차장이 비어있을 때 공간을 대여해주는 서비스를 하고 있다.
금융과 IT를 결합한 핀테크 분야에서 빅데이터의 가치는 더 높아진다. 개인과 개인 사이의 대출을 중개해주는 스타트업 펀다(FUNDA)는 대출을 원하는 지역 상점들의 매출 단말기(PoS·Point of Sales)에 있는 매출 정보를 활용해 대출 금액을 결정하고 있다. 매출 정보를 활용하면 그 상점의 상환 능력을 예측할 수 있기 때문이다.
활용할 데이터가 충분히 누적되면 이를 기반으로 컴퓨터가 스스로 학습하는 머신러닝(기계학습) 서비스도 가능해진다. 로봇이 사람의 업무 일부를 대신할 수도 있다. 시장조사업체 가트너는 지난 8일 “2018년이면 주주보고서나 법률문서, 시장보고서 같은 업무용 문서의 20%는 로봇이 작성하게 될 것”이라며 “ 인사나 업무평가 영역도 로봇 상사(robo-boss)가 맡게 될 것”이라고 내다봤다.
실제로 자산관리 분야에서 최근 빅데이터를 활용한 로봇 서비스가 등장했다. 이른바 로보어드바이저(robo-advisor)다. 오랜 경험에서 나오는 노하우와 감(感)이 아닌 데이터에 근거해 인공지능 로봇이 투자를 결정한다. 몇 가지 정보로 투자 성향을 분석한 후 이에 맞는 투자 계획을 로봇이 세워주는 방식이다.
국내에서 최초로 로보어드바이저 기술을 선보인 쿼터백테크놀러지는 전 세계의 상장지수펀드(ETF) 데이터를 모두 분석해 글로벌 투자 포트폴리오를 짜주는 알고리즘(작동 방식)을 개발했다. 이 회사의 김승종 대표는 “ 소수의 고액 자산가들이나 이용할 수 있던 자산관리 서비스를 누구나 저렴한 비용에 모바일 앱으로 이용할 수 있는 시대가 된 것”이라고 말했다.
이처럼 빅데이터가 사회 전반에 전방위로 퍼져 있지만 아직 국내 상황은 걸음마 수준이다. 특정 홈페이지를 해킹해 탈취한 개인정보를 사고팔다가 붙잡힌 사건·사고들이 주로 부각되다 보니 데이터 유통에 대한 거부감이 크다. 분석에 활용할 수 있는 양질의 빅데이터도, 이를 분석할 수 있는 데이터 과학자도 수요에 비해 역부족이다.
조성준 서울대 산업공학과 교수는 “국내에는 분석에 쓸 수 있는 데이터가 적고, 데이터보다는 감이나 경험에 근거해 의사 결정을 하는 문화가 뿌리깊어 빅데이터 생태계의 발전 속도가 더디다”고 말했다. 조 교수는 또 “앞으로는 데이터가 곧 경쟁력이 되기 때문에 기업들은 투자자들에게 보유한 빅데이터 목록을 공개하고 평가받아야 할 것”이라고 했다.
핀테크 열풍이 뜨거운 금융 산업에서는 최근 빅데이터에 대한 갈증을 직접 풀려는 움직임도 나오고 있다. 임종룡 금융위원장은 최근 한 포럼에서 “개인정보를 규율하는 법률 자체가 20개가 넘고, 정보보호 규율이 복잡하게 얽혀 있다”며 “비식별화된 개인정보 이용에 관한 가이드라인을 명확히 만들어 금융권에서 활용할 수 있도록 하겠다”고 밝혔다.
최근 국회에서도 개인정보를 익명으로 처리한 후 빅데이터로 활용할 수 있도록 하는 법률 제·개정안이 발의됐다. 지나친 규제보다는 데이터 유통 과정을 투명하게 하자는 목소리도 힘을 얻고 있다. 미국 공정거래위는 데이터 브로커들의 영향력이 커지자 이들이 유통하는 정보를 개개인에게 공개하도록 의무화하고 거래 대상에서 삭제할 수 있도록 조치했다.
정보통신정책연구원의 정용찬 ICT통계분석센터장은 “정보 약자인 소비자의 자기 정보에 대한 권리는 규제보다는 정보유통의 투명성을 높이는 방법으로 보장해야 데이터 유통과 빅데이터 산업이 발전할 수 있다”며 “데이터 보안·암호화와 같은 기술이 빅데이터 산업의 경쟁력이 될 것”이라고 말했다.
박수련 기자 park.suryon@joongang.co.kr
로보어드바이저(robo-advisor)=로봇을 뜻하는 로보(robo)와 자산운용 전문가를 의미하는 어드바이저(advisor)의 합성어. 모바일 기기나 PC를 이용해 자동화된 컴퓨터 알고리즘(작동 방식)으로 투자 의뢰자의 자산을 관리해주는 온라인 서비스를 말한다. 시장 상황이 변하면 컴퓨터가 자동으로 자산 배분을 조정한다. 관리 수수료는 전문가 서비스의 절반 정도다.
출처: http://news.joins.com/article/18844616