이번 이야기는 지난 이야기 38. Data가 만들어내고 있는 새로운 경제의 연속편으로 그 두 번째 이야기입니다. The Economist 의 5/6/2017 일자 Data is giving rise to a new economy; How is it shaping up? 을 번역한 내용입니다.
——————-
데이터의 우물에 깊이 빠져들고자 하는 노력은 단지 테크 회사들만의 이야기는 아니다. 예를 들어 GE는 고객이 기계를 제어 할 수 있도록 Predix라고하는 산업용 인터넷 운영 체제를 개발했다.Predix역시 데이터를 수집하는데 연결된 장치의 데이터를 저장하고 다른 데이터와 연동하여 엔진이 고장 내기 전 혹은 그 유사한 상황에서 어떻게 기계 작동하고 유지하는지에 대한 알고리즘을 향상시키고, 스스로 학습하게 한다.
과거 석유 시장에서와 마찬가지로, 이제 큰 데이터 회사는 계속 작은 회사를 인수하고 있다. 그러나 20세기의 석유와는 대조적으로 데이터가 직접 거래되는 일은 거의 없다. 이는 세계 경제 포럼 (World Economic Forum, WEF)에 발표한 한 보고서에서 데이터를 “새로운 자산 등급”으로 말했을 때 이것을 두고 많은 사람들이 생각했던 것과는 거리가 멀다. 데이터 경제는 그 단어가 암시하듯이 비트와 바이트를 위해 번성하는 시장이 될 것이다. 이 의미는, 오픈 마켓에서 사고 팔던 석유 시장과는 다른 개념의 시장이 등장함을 암시한다.
당신 스스로에게 맡기기 (번역자 첨언: 20세기 시장 논리가 희박해지는 시대)
데이터 경제에서 시장이 존재하지 않는다는 것은 어찌보면 기업 입장에서 보면 당연한 결과다. 과거의 시장 경제에서는 정보 검색, 거래 협상, 계약 시행 등 모든 종류의 “거래 비용”을 지불함으로써 기업들은 시장에서 이러한 활동을 더 간단하고 효율적으로 수행할 수 있었다. 이제는 공개 시장에서 데이터를 사고 파는 것보다 회사 내부의 데이터를 생성하고 사용하는 것이 기업 입장에서 더 유리한 상황이 되었다.
그 풍요로움에도 불구하고 사실 데이터의 흐름은 필수품이 아니다. 정보의 각 스트림은 시간에 따라 혹은 그 정보의 완성도 측면에서 다르다. 경제 용어에서 말하는 “대체 가능성(fungibility)”이 부족하여 구매자가 원하는 특정 데이터 세트를 찾고 가격을 책정하기가 어렵다. 또한 각 유형의 가치는 다른 데이터와 비교하기가 어렵다. 거래의 양 당사자입장에서는 스스로가 불이익을 당하는 쪽이라는 불안감이 있으므로 거래는 성사되기가 또한 어렵다. 가트너 같은 리서치기관들은 이제 막 이것의 가격을 매기기 위한 방법론들을 개발하기 시작했고 그들은 이것을 “Infonomics” 라고 부른다. 대학 등에서도 데이터의 가치에 대한 사례연구들이 진행되고 있는데 그 중 하나가 San Diego 대학의 Jim Short에 의한 연구로 2015년에 파산한 한 도박회사의 지난 17년 동안의 고객 로열티 프로그램에 가입한45,000 명의 정보가 약 10억달러로 결정이 된 적이 있다.
가격 책정의 어려움 때문에 때로 기업들은 단지 어떤 회사의 데이터에만 관심이있는 경우에 그 회사를 통째로 사 버리는 것이 더 쉽다고 생각하게 된다. 2015 년 IBM이 Weather Company에 20 억 달러를 들여서 기상 데이터와 날씨 수집 데이터를 수집하는 인프라를 확보한 것이 그 대표적인 예다.
디지털 정보가 석유와 달리 “비 라이벌 적” 이기 때문에 한 번에 둘 이상의 사람 (또는 알고리즘)이 복사하여 사용할 수 있고, 이는 더 많은 혼란을 야기시킬 수 있다. 이는 데이터가 동의 한 것 이외의 목적으로 쉽게 사용될 수 있음을 또한 의미한다. 그리고 누가 데이터를 소유하고 있는지 혼란스럽게한다. (자율 차량의 경우 자동차 제조업체, 센서 공급 업체, 승객 그 모두 중 누군가가 데이터의 소유주가 될 수도 있다. )
전문가들은 “데이터를 거래하는 것은 매우 지루한 일”이라 말한다. 그때 그때 다른 내용들이 계약에서 합의되어야 하고, 허용되는 용도와 데이터 보호 방법을 지정하는 언어와 함께 수십 페이지의 법적 문서로 실행되는 경우가 많으니, 아무리 데이터가 가치있는 것이라 해도 이 엄청난 문서들을 만드느니 더 가치있는 일을 하는게 낫다고 비꼬는 은행간부도 있다.
개인 데이터의 경우 상황이 훨씬 더 까다롭다. 뉴욕 대학의 Kenneth Laudon은 1996 년 “Markets and Privacy”라는 매우 영향력있는 기사를 썼는데 그 기사에서 “규제된 국가 정보 시장은 판매자에게 정보가 누설되는 정도를 결정할 권리를 부여하여 개인 정보가 매매 될 수 있게 할 수 있다.” 라고 했었다. 최근에는 WEF가 데이터 은행 계좌 개념을 제안했는데 이는 한 개인의 데이터는 “통제, 관리가 될 수 있는 계좌 안에 있어야 한다.”는 것이다.
아이디어는 우아해 보이지만 시장이나 데이터 계정은 아직 구체화되지 않았고, 문제는 기업 데이터에 대해서는 오히려 그 반대의 경우가 발생하고 있다는 것이다. 개인 정보가 그렇게 중요하다고 생각하면서도 사람들은 “무료”서비스에 대한 대가로 개인 데이터를 너무 쉽게 줘 버린다는 것이다. 마이크로 소프트 리서치 (MS Research)의 경제학자 글렌 웨일 (Glen Weyl)은 이 트레이드 조건이 우연히도 거의 표준이 되었다고 전했다. 2000년대 초 버블 붕괴 이후 기업들은 돈을 벌 수있는 방법이 절실히 필요했고, 타겟 광고를위한 데이터 수집이 가장 신속하게 수행되기 시작했다. 많은 사람들이 최근에야 데이터가 수많은 AI 서비스로 바뀔 수 있음을 깨닫게 되었다. (번역자 첨언 : 우리는 이미 우리의 개인 정보를 많은 회사에 스스럼없이 동의하여 줘 버렸다. 어떤 서비스에 가입하기 위해 당신과 나는 이미 나의 데이터 거래 조건을 승락하고 Next 버튼을 클릭했다..)
알고리즘의 노예가 되는 시대
무료 서비스에 대한 데이터의 거래가 불공정한 것인지의 여부는 주로 이러한 서비스들이 만들어 내는 가치의 근원 – 서비스가 프로세싱 될때 사용이 되는 그 데이터나 혹은 그 알고리즘- 이 무엇인가에 따라 달라진다. 구글의 수석 이코노미스트 인 Hal Varian은 데이터에 관한 한”규모에 대한 수익의 감소” 즉, 데이터가 추가 될 때마다 가치가 떨어지며, 수집 더 한다고 해서 더 많은 것이 더해지지 않는다고 말한다. 더 중요한 것은 회사가 데이터를 개발하기 위해 고용한 재능있는 인력과 데이터를 제대로 프로세싱할 수 있는 알고리즘의 품질이라고 말한다. 그의 말을 빌리자면 구글의 성공은 “재료가 아니라 조리법”이라는 것이다.
그 주장은, 온라인 검색의 초기에는 사실일지도 모르지만 AI가 용감하게 등장한 새로운 세계에서는 틀린 것처럼 보인다. 알고리즘은 점점 더 스스로 학습을 하기 시작했고, 더 많은 새로운 데이터가 제공이 될 때 알고리즘은 더 똑똑해 진다. 많은 학자들은 응용 프로그램이 늘어남에 따라 데이터의 한계 수익률이 실제로 올라갈 수 있다고 말한다. 예를 들면 Uber나 Grab (번역자 첨언 : 우리나라의 Kakao 택시) 같은 교통 서비스를 제공하는 회사가 하나의 서비스 실시간 트래픽 정보를 제공하기에 충분한 데이터를 수집 한 후에는 더 많은 데이터가 그 가치를 더할 수 없을 수도 있다. 그러나 데이터 수집을 계속한다면 어떤 시점에서 경로 계획과 같은 더 많은 서비스를 제공 할 수 있는 가능성이 높아진다.
이러한 상반되는 입장의 토론들은, 날로 많아지는 데이터 거래에 대한 정보의 부족과 함께 초반에 많은 혼란과 혼돈을 일으킬 수 있도 있다. (번역자 첨언: 어쩌면 이것은 당연히 지나가야 될 과정이다.) 사실 석유가 시장에서 제대로 거래되게 하기까지 수십 년의 시간이 걸렸었다. 역설적이게도 19 세기 후반 존 록펠러 (John D. Rockefeller)가 창안한 독점적인 표준 오일 (Standard Oil)로 모든 것이 빨라졌고, 관련 기술과 표준이 만들어졌고 드디어 이 새로운 것이 거래되는 것이 가능해졌다.
—–
다음 이야기에서는 마지막으로 이 기사가 이야기하고자 하는 디지털의 세계에 대해 마무리를 하겠다.
데이터를 거래하는 일이 지루할 수 있겠습니다. 그러나 개인의 예정, 상황, 소유 정보가 실시간으로 통계로 생성되고 활용되는 사회는 지루하지 않을 겁니다. 정보사회에서 데이터는 거래보다 공기, 물, 전기처럼 활용되는 거죠!