과거 빅데이터라는 단어가 유행했던 것처럼, 최근 유행하고 있는 말이 ‘데이터과학’이다. 개발자, 엔지니어가 아닌 비전문가 입장에서는 그 단어 자체가 어색하고 모호하게 느껴질 수 있다. 기획자나 마케터는 데이터과학을 왜 알아야 하는지, 구체적으로 어떻게 접근할 수 있는지 알쏭달쏭하기만 하다. 10월29일 <블로터>가 주최한 ‘데이터과학 오디세이 2015’ 컨퍼런스에서 이와 관련된 발표가 이어졌다. 스타트업 넘버웍스를 운영하는 하용호 대표가 소개하는 데이터과학 원칙을 들어보자. 꼭 기획자나 마케터가 아니어도 데이터과학에 대한 개념이 낯선 이에게 알찬 정보다.

Data_Odyssey_2015_05

▲하용호 넘버웍스 대표

1. 데이터과학은 기업에 ‘기회’

어떤 제품이나 서비스를 만들기 위해 크게 2가지 과정을 겪는다. 아이디어를 고민해 실제 제품을 구현하는 과정과, 제품을 만들고 난 뒤 사람들의 반응을 확인하는 과정이다. 최근 스타트업일수록 이러한 제품 개발 주기를 빠르게 운영하고 있다. 하용호 대표는 “후자의 과정은 현재 기업들에게 익숙지 않은 부분이지만, 제품의 반응의 확인하면서 고객이 원하는 것을 찾을 수 있다”라며 “그래서 데이터를 들여다보는 시대로 가고 있는 것”이라고 설명했다.

Data_Odyssey_2015_02

▲사진:하용호 대표 발표자료

어떤 서비스가, 제품이 고객에게 주목받으려면 경쟁력이 있어야 한다. 처음에는 그런 경쟁력이 기술이 될 수 있다. 하지만 기술은 결국 평준화되게 되기 마련이다. ‘가격’도 경쟁력이 될 수 있지만 점점 저렴해지고 중국산 제품과 서비스들이 선택되고 있는 실정이다. 하용호 대표는 이런 상황에서 기업이 선택할 수 있는 또 다른 경쟁력을 “적절한 기회를 잡는 것”이라고 설명했다. 다시 말해 고객에게 무엇인가 필요한 시점을 알아채고 제품을 내놓는 것이다. 예를 들어, 스마트 체중계와 스마트폰을 동시에 판매하면 스마트 체중계로 체중을 줄일 시기를 실시간으로 파악하고 스마트폰에서 다이어트 식품 정보를 제안할 수 있다.

이러한 과정을 도와주는 사람을 데이터과학자라고 부른다. 데이터과학자란 데이터에서 패턴을 찾아내 비즈니스 기회로 만드는 사람이다. 프로그래머, 통계학자, 컨설턴트의 자질이 모두 필요한 직업이다. 예를 들어, 데이터과학자들은 대형마트에서 사용자의 구매 패턴을 살펴보고 “맥주와 기저귀를 같이 놓으면 매출이 상승할 수 있다”라는 결론을 기업에 제안할 수 있다.

Data_Odyssey_2015_01-re

▲사진:하용호 대표 발표자료

2. 데이터 가치 알려주는 ‘뱅뱅이론’과 ‘심슨의 패러독스 이론’

국내에서 가장 인기있는 청바지 브랜드는 무엇일까. 리바이스, 캘빈클라인, 유니클로 등의 브랜드가 먼저 떠오르시는가. 하지만 국내에서 가장 높은 점유율을 차지하는 청바지 브랜드는 ‘뱅뱅’이다. 내 주변에서는 뱅뱅 청바지를 입은 사람이 별로 없는 듯하지만, 실상은 상당수가 뱅뱅 청바지를 구매하고 있었던 셈이다. 뱅뱅이론은 나와 내 주변 사람들이 다 동의해 사실로 받아들였던 부분이 알고보니 진실이 아니라는 걸 의미하는 말이다. 하용호 대표는 “데이터를 기반으로 진짜 세상의 반응을 측정해야 한다”라며 “내 생각은 데이터를 보기 전에는 맞는지 알 수 없다”라고 설명했다.

‘심슨의 패러독스’는 부분으로 수치를 봤을 때와 전체를 봤을 때 서로 평가가 뒤바뀌는 현상을 말한다. 예를 들어 A병원과 B병원의 암 치료율이 아래와 같이 공개됐다고 치자. 각각 500명의 환자를 기준으로 A병원의 치료율은 58%였고 B병원의 치료율은 64%였다. 수치만 봐선 암환자에게 좋은 기업은 B병원으로 보인다. 하지만 이때 간암과 위암으로 나누어 치료율을 비교해보면 A병원이 더 진료를 잘한다는 결과를 얻을 수 있다.

Data_Odyssey_2015_03

▲사진 : 하용호 대표 발표 자료

하용호 대표는 “전체 데이터를 그냥 보면 대다수가 상식에 입각해 해석한다”라며 “데이터를 나눠서 해석하면 원래 알던 것과는 다른 사실을 알 수 있다”라고 말했다.

3. 측정 가능한 목표를 설정하자

학교에서 교장선생님이 “훌륭한 사람이 되라”라고 말했고, 담임 선생님은 “영어점수 80점을 꼭 넘겨라”라고 말했다. 학생에게 내일 당장 어떤 행동을 유발하려면 후자의 조언이 더 효과적이다. 결과에 대해 측정할 수 있고, 달성하기 위한 방법이 쉽게 떠올려지고, 빠르게 계산해낼 수 있기 때문이다. 비슷한 상황을 기업에도 적용할 수 있다. 너무 무리한 목표를 잡아서도 안된다. 가입자수를 늘리고 싶고, 결제율을 높이고 싶고, 핵심 사용자수를 늘리고 싶다 할지라도 일단 무엇에 먼저 집중할 건지 정해야 한다. 이제 막 시작하는 기업이라면 가입자수를 늘리는 것을 중요시할 것이고, 어느정도 가입자수가 확보된 기업은 유료 결제 사용자를 늘리길 희망할 것이다. 그래서 일단 달성해야 하는 목표를 설정하고 나면 현재 단계에서 기업이 원하는 것이 무엇인지 파악하는데도 도움이 된다.

4. 데이터과학은 ‘농사’가 아니라 ‘사냥’

보통 기업은 1년간 계획을 세우고 매달 필요한 것을 실행한다. 이 과정에서 끊임없는 보고가 일어난다. 마치 가을 수확을 위해 한 해 동안 농사를 짓는 것과 비슷한 모습이다. 데이터과학은 이러한 방식으로는 진행될 수 없다. 원하는 결과를 얻기 위해 계획을 하고, 시도하고, 검토하는 과정이 아주 빠른 주기로 반복된다. 이 속도가 빠를수록 데이터과학 결과물도 좋아질 수 있다. 보고 과정이 줄어야 하고 실무자에게 권한을 위임하는 과정도 필요한다. 하용호 대표는 “물론 이 과정이 전통적인 기업에서 쉽지 않다는 것을 알고 있다”라며 “하지만 보고체계가 긴 문화에서는 데이터과학을 적용하는 건 힘들다고 보면 된다”라고 설명했다.

datascience_04

▲사진 : 하용호 대표 발표 자료

 

5. 매출도 올리고, 피드백도 받는 A/B테스트의 힘

A/B 테스트는 여러가지 서비스를 동시에 내놓고 같은 상황에서 사용자의 반응을 실험하는 것을 뜻한다. 예를 들어 새로운 게임이 출시됐을 때 사전 예약 배너가 있는 홈페이지와 배너가 전혀 없는 홈페이지 중 매출을 올려주는 디자인은 어떤 것일까? 배너로 미리 게임소식을 알려주면 사람들이 많이 클릭할 것 같았지만 실제로 심시티라는 게임에서서 실험한 결과 광고 배너가 없는 홈페이지에서 구매자가 43% 더 많았다. 그렇다고 모든 매출이 배너가 없을 때 높아지는 것은 아니며 제품, 사용자 등 데이터에 따라 결과는 달라진다.

Data_Odyssey_2015_04

▲사진:하용호 대표 발표자료

기업 입장에선 A/B테스트의 효과는 알지만 같은 기술을 여러번 구축하기 어려운 상황일 수도 있다. 하용호 개발자는 “그래도 ‘마케팅’이나 ‘사용자 조사’ 영역에서는 비교적 A/B테스트를 쉽게 도입할 수 있다”라고 설명했다. 이때 ‘옵티마이즈리‘라는 A/B테스트 전문 홈페이지의 무료 버전을 이용하거나 페이스북 광고 페이지로 이러한 A/B테스트를 시도할 수 있다. 하용호 대표는 “우리 고객이 어떤 것을 좋아하는지 지식을 탐구하거나 피드백을 받는 도구로 A/B테스트를 이용해도 된다”라고 설명했다.

6. 데이터과학은 요술봉이 아니다

어떤 기업은 데이터과학을 요술봉으로 생각하기도 한다. 모든 문제를 해결해주고 새로운 아이디어를 줄 것이라고 기대하는 것이다. 하용호 대표는 “데이터과학은 점진적인 개선의 도구”라며 “기존의 것에서 10%가 좋아지고, 다시 10%가 좋아지면서 변화를 만들 수 있다”라고 설명했다.

물류 전문기업 UPS가 대표 사례다. UPS는 1990년대부터 많은 데이터를 수집했다. 이들이 모은 데이터는 엔진 센서, 차량 이동경로, 송장 처리 기록까지 다양하다. UPS는 택배과정을 크게 4가지로 구분했다. 과거엔 무작정 물건을 배정했다면, 데이터를 수집한 뒤부턴 배달기사의 이동 경로에 따라 택배량을 조절했다. 또 운전하기 쉬운 우회전 방향으로 배달 지역을 배치했다. 짐칸을 여는 과정에서 시간이 지체되는 것을 확인하고 버튼 하나를 누르면 시동이 바로 꺼지고 뒷문이 자동으로 열리는 기술을 개발해 수송차량에 적용하기도 했다. 배송 과정에서 자주 쓰는 사인펜은 왼쪽 가슴 주머니에 넣는 게 효율적이란 것도 데이터를 통해 발견해냈다.

Data_Odyssey_2015_06

▲사진:하용호 대표 발표자료

이러한 작은 변화들은 곧바로 성과로 나타났다. UPS 배달원들은 이전까지 하루평균 90개의 물건을 배달하다 새 시스템 적용 이후 130개까지 배달할 수 있었다. 주유비는 500여억원이 감소했다. 배달기사들의 사고도 줄었고, 운영비용이 줄어들며 기사들의 임금이 인상되기도 했다.

하용호 대표는 “UPS는 10년 넘게 데이터를 수집하고 점진적으로 상황을 개선했다”라며 “여전히 택배회사이지만, 기존 일을 데이터로 더 잘 하게 됐다”라고 설명했다.

datascience_conference_hayongho


출처: https://www.bloter.net/archives/242233

Posted by insightalive
,