이야기 38. Data가 만들어 내고 있는 새로운 경제 (1)

최근 지인으로부터 이 블로그 내용에 대한 피드백을 들은 적이 있다. 데이터 분석에 대한 주제가 지나치게 전문가를 위한 내용이라서 이해하기가 어렵다는 것이다. 피드백을 준 지인은 여러 분야의 책을 매우 심도 깊게 읽는 친구이고, 데이터 분야의 일을 하지 않지만 세상의 변화에 관심을 가지는 것을 알고 있는 터라 그녀의 피드백은 나를 고민하게 했다. 요지는 내용 자체가 어렵다기보다는 데이터가 세상에 주는 영향은 매우 클 것 같은데 도대체 우리의 생활에 어떤 영향을 주게 되는 것인가에 대한 연결이 어렵다는 것이다. 매우 의미있는 피드택이란 생각이 들었다.

내가 쓰고 있는 블로그는 같은 시대를 사는 모든 사람들의 삶에 연결이 되어 있는 주제인데 그것을 접근하는 방법이나 주제가 어때야 할지, 매주 나에게는 숙제같은 것이 사실이다. 섣불리 뭔가가 훈수를 둘 수 있는 내공도 아직 안되는 지라 어떻게 이것을 정리하면서 다시 시작하면 좋을까 고민하던 차 였다. 그러다가 우연히 The Economist에 실린 이 글을 접했고, 어느 정도 내가 하고 싶은 이야기를 멋진 문장으로 풀어내 주고 있다는 생각이 들었다. 일부만 차용하기는 아깝다는 생각이 들어서 번역을 해 보기로 마음 먹었다. 앞으로 3회에 걸쳐서 The Economist 의 5/6/2017 일자 Data is giving rise to a new economy; How is it shaping up? 을 번역한 내용을 소개하고자 한다.

——————————————-

근대의 정유 공장은 권력과 드라마와 암흑진 구석이 존재하는 중세의 대성당의 모습을 하고 있다. 균역이 생긴 타워는 마치 고딕양식의 뾰족한 첨탑을 닮았고 이글거리고 타는 가스는 마치 스테인글라스 같으며 탄화수소의 악취는 성당안 가득한 향내를 닮았다. 그런데 그 반면 현대의 데이터센터는 눈에 별로 띄지 않는 스펙타클을 제공한다. 높이도 장식도 창문도 없는 회색의 건물이 그저 무한대로 늘어날 것만 같이 보인다.

그러나 두 건물 사이에는 많은 공통점이 존재한다. 그 중 한 가지는 모두 파이트로 채워져 있다는 것이다. 정유 공장에서는 열에 의해 분리 된 가솔린, 프로판 및 기타 원유 성분을 수집한다. 대형 데이터 센터에서는 원시 디지털 정보에서 가치 패턴, 예측 및 기타 통찰력을 추출하는 수만 대의 컴퓨터를 냉각시키기 위해 공기를 운반한다.

어떤 면에서 이 두 공장들은 같은 역할을 수행하고 있는데, ‘세계 경제를 위한 중요한 공급 원료를 생산하는 것’이 그것이다. 원유가 없이 자동차, 플라스틱 또는 많은 약물들의 존재는 상상할 수가 없다. 마찬가지로 데이터 센터를 통한 데이터의 정제 작업은 모든 종류의 온라인 서비스를 점점 강하게 도와주고,  세상에 존재하는 수많은 디바이스들이 현실 세계가 긴밀하게 연결되도록 한다.

데이터는 21세기의 석유다. 지난 세기에 성장과 변화의 원동력이었던 석유가 한 그 역할을, 이번 세기에는 데이터가 담당하고 있는 있는 것이다. 데이터의 흐름은 새로운 인프라, 새로운 비즈니스, 새로운 독점, 새로운 정치 및 결정적으로 새로운 경제를 창출했다. 디지털 정보는 이전의 어떤 자원과도 다르다. 그것은 다른 방식으로 추출, 정제, 가치 평가, 매매 및 판매된다. 그러므로 이것은 시장의 법칙을 바꾸었고, 시장 규제에 대한 새로운 접근 방법에 대한 요구가 생겨났다. 누가 데이터를 소유하고 혜택을 얻을 수 있는지에 대한 이권 다툼이 벌어질 것은 자명하다.

여기 엄청난 통계가 있다. 시장 조사 기관인 IDC는 2025 년에 “디지털 우주”(매년 생성되고 복사되는 데이터)가 180 제타 바이트 (180 X 1021) 바이트에 도달 할 것으로 예측된다. 광대역 인터넷 연결을 통해 이 모든 것을 보내려면 약 4500 억 (450 X 109 )년이 걸린다. 클라우드 컴퓨팅 분야에서 급성장하고있는 아마존은 데이터 센터로 데이터를 운반하기 위해 위해 각 100 페타 바이트 (약 1015 )를 저장할 수 있는 스토리지를 실을 수 있는 트럭을 사용한다. 이를 모두 흡수하기 위해 각 기업들은 신속하게 정유 공장이 아닌 데이터 정제 공장을 세우고 있다. 월 스트리트 저널 (Wall Street Journal)에 따르면, 2016 년 아마존에서 Alphabet과 Microsoft는 자본 지출 및 자본 임대로 거의 3200 억 달러를 벌어 들였고, 이는 전년도보다 22 % 증가한 수치이다.

데이터의 품질도 변화하게 되었다. 그들은 더 이상 주로 이름과 연령, 성별 및 소득과 같은 잘 정의된 개인 데이터같은 디지털 정보를 쌓아놓는데는 별로 관심이 없어졌다 그 대신 새로운 경제는 구조화되지 않은 데이터의 빠른 실시간 흐름을 분석하는 것이 더 중요해졌다. (번역자 첨언 : 이것이 요즘 디지털 마케터들이 이야기하는 Contextual한 데이터를 의미한다.) 예를 들면 소셜 네트워크 사용자가 출퇴근 시간에 생성한 사진 및 비디오 스트림, 제트 엔진의 센서에서 실시간을 얻어진 수많은 데이터 스트림 처럼 지하철으로부터 풍력발전의 터빈, 화장실 좌석으로부터 토스터에 이르기까지 모든 종류의 장치가 데이터 소스가 되고 있다. 이제 사람들은 인터넷에 연결되어 있지 않아도 연결된 모든 센서를 연결하여 사람들이 어디를 가든지 디지털 흔적을 남길 수 있게 되었다. 데이터는 결국 “(그것이 긍정적 혹은 부정적이든 간에 ) 궁극적인 외부 효과 혹은 그 결과로 나타날 것이다.”

당신이 알고 있는 것. (혹은 아직 모르고 있다면 알아야 하는 것– 번역자 첨언)

가장 중요한 것은 데이터의 가치가 증가하고 있다는 것이다. 처음에 Facebook과 Google은 그들이 수집한 사용자 데이터를 토대로 광고에 타겟하는데 주로 사용을 했었다. 그러나 최근 몇 년 동안 그들은 이 데이터가 인공 지능 (AI) 또는 인지 서비스로 활용될 수 있다는 것을 발견하게 되었고, 이것들의 일부는 새로운 수익창출원이 될 것이라는 것을 잘 알고 있다. 이러한 서비스에는 번역, 시각적 인식 및 사용자들의 글을 읽어서 사용자들의 성격 및 성향을 평가하는 등의 기능도 포함이 된다. 이 모든 기능은 새로운 상품으로 포장되어 다른 회사에 판매되고,  그들의 이 제품을 그 들의 서비스에 사용될 수 있게 된다. (번역자 첨언 : 이 대목에서 우리는 Facebook이나 Google이 왜 무료도 사용자들에게 엄청나게 좋은 서비스를 제공하는지 그 이유를 알 수 있다. 우리가 제공하는 이 엄청난 데이터들- 사진들, 내가 매일 올리는 수많은 포스트들, 내 친구들과의 모든 추억들, 공감했던 많은 컨텐츠들이 향후 그들의 수익원인 샘이니 우리는 충분히 그 값을 치르고 있는 것이다. 세상엔 공짜가 없다.)

데이터 경제의 징후가 도처에 있긴 했었지만, 그 모양은 최근에 들어서 점점 분명 해지고 있다. 데이터를 소유하고 관리하는 그룹(데이터 메이저들), 데이터를 불법적으로 소유하고자 하는 그룹(야생고양이들), 그리고 많은 다른 회사들이 뭔가 행동을 취하고자 한다. 모두가 “데이터 네트워크 효과”라는 강력한 경제 엔진을 활용하여 데이터를 사용하여 더 많은 사용자를 유치하고 더 많은 데이터를 생성하여 서비스를 향상시켜 더 많은 사용자를 끌어들이려고 한다.

데이터 메이저는 물이 가장 풍부한 저수지에서 펌프질을 한다. 예를들면 Facebook에서 더 많은 사용자가 댓글을 쓰거나 “좋아요”와 같이 반응을 하면서 참여할수록, 즉 그 사용자에 대해 더 많이 알수록 뉴스 피드의 광고가 더 잘 타겟팅 되도록 한다. 마찬가지로 Google에서 더 많은 사람들이 검색할수록 검색 결과는 더 정확하고 좋아지게 된다.

이 회사들은 항상 새로운 정보 우물을 찾고 있는 것이다. Facebook은 사용자가 친구의 사진을 업로드하고 태그를 추가 할 때 알고리즘을 훈련 시키게된다. 이것으로 어떻게 컴퓨터가 현재 수억 명의 사람들을 98%의 정확도로 인식 할 수 있는지가 설명이 된다.(번역자 첨언: Facebook에서 같이 찍은 친구의 사진을 업로드 하려고 할때 내가 Tag하지 않아도 자동으로 그들의 얼굴 아래 이름이 자동으로 Tag 되는 것은 바로 이 때문이다.)  ‘Assistant’라고하는 Google의 디지털 버틀러(집사)는 더 많이 사용할수록 작업 수행과 질문에 더 잘 대답하게 된다.

우버 (Uber) 가 6 백억 달러의 가치가 있다고 추정하는 이유 중의 하나는 개인 수송을 위한 공급 (운전자)과 수요 (승객)에 관한 가장 큰 데이터 풀을 소유하고 있기 때문이다. 비슷하게, 대부분의 사람들에게 테슬라는 멋진 전기 자동차 회사로 알려져 있지만, 더 중요한 부분은 이 회사의 최신 모델은 엄청난 데이터를 수집하여 자동 운전 알고리즘을 최적화하고 이에 따라 소프트웨어를 업데이트 할 수 있도록 하게 했다는 것이 더 중요한 포인트다.

————————–

21세기의 데이터는  더 이상 데이터를 다루는 사람들만의 이야기가 아니다. 다음 스토리에서는 우리는 이 변화를 어떻게 이해해야하는 지에 대해 더 자세히 이야기 해 보겠다. Stay tuned!

5 comments

  1. 지인이 인사이트 있는 글이라 링크를 공유해 들려 봤었습니다. 정보가 정보사회 핵심 자원이 될 것이라는 예측에 누구도 이의가 없네요. 안타까운 것은 오픈데이터, 빅데이터, 개인 정보가 호박과 수박만큼이나 같지만, 전혀 다르다는 것을 인지하지 못하고 있는 겁니다. 혁명과 혁신이 우주선과 비행기만큼이나 다른 것인데 둘 다 날아 다니는 것으로 묶어 보는 것 이상으로 호박과 수박을 같은 박으로 묶어 논하는 것은 안타까운 일입니다. 같은 박이기에 접붙이기가 되지만 호박과 수박은 모양, 맛, 색, 먹는 방법 전혀 다른 거죠! 한명주님이 쓰신 글을 읽는 분들이나 한명주님도 이런 문제 의식을 가지고 읽고 옮기신다면 먼가 좀 더 발전적일 수 있겠다는 생각에 댓글 남깁니다.

    출간을 목적으로 쓰고 있는 원고에 일부를 공유합니다. 정보사회 핵심이 되는 정보는 공공정보(오픈데이터)나 빅데이터(수집 정보)가 아니라 개인이 의지를 가지고 생성하는 자신의 예정, 상황, 소유 정보라고 판단합니다.

    #개인정보 소유권

    정보사회 핵심 자원이 될 개인이 생성하는 정보는 두 가지다. 하나는 교통카드, 신용카드 사용처럼 개인이 특별한 지적활동이나 노력 없이 일상생활에서 부수적으로 발생하는 로그정보입니다. 하나는 개인이 지적활동으로 노력하여 생성하는 예정, 상황, 소유 정보이다.

    개인이 생성하는 정보의 소유권은 땅과 건물, 자동차처럼 실체에 대한 소유권은 물론 내용은 있지만 실체가 없는 저작권, 특허권, 상표권과는 다르다. 현재 법률로 인정, 보호되는 권리는 인간의 지적 결과물로서 고유성, 진보성, 경제적 가치가 있는 것에 부여되는 것이다. 사용자가 지적활동을 통해 생성하는 자신의 글, 사진, 소리, 영상 등의 저작권은 분명히 인정되고 보호된다.

    개인이 컴퓨터, 스마트폰을 켜는 순간부터 생성되는 로그정보, 교통카드나 신용카드를 사용하며 발생시키는 로그정보는 개인의 지적 활동의 결과물은 아니다. 사용자가 추가적 노력 없이 발생시키는 로그 정보의 사회경제적 가치는 컴퓨터, 인터넷, 스마트폰의 일상화가 만들어 낸 것으로 기존 관점과 개념에 존재하지 않던 가치, 존재했지만 사회경제적으로 활용할 수 없던 가치이다. 로그 정보는 이전에 활용할 수 없었던 생활의 흔적이다. 개인이 일상생활에서 추가적 노력 없이 발생시키는 로그 정보에 사회경제적 가치가 있고, 높아지겠지만 고유성, 진보성이 있다 하긴 어렵다. 자동차 배기가스 발생은 자동차 운행의 결과물일 뿐이지, 배기가스를 배출시키기 위해서 자동차를 운행하는 것은 아니다. 얼핏 개인이 생성하는 로그정보에 대한 소유권 인정과 로그정보를 활용하여 창출된 가치를 기여만큼 공유해야 한다는 주장은 자동차 배기가스에 세금을 부과하자는 주장처럼 황당하게 느껴질 수 있다. 그러나 자동차가 배기량에 따라 취득세, 등록세, 재산세 액수를 달리하고 있음을 생각하면 황당한 것이 아니다. 연료로 무엇을 사용하던 연료에는 다양한 세금이 포함돼 있고, 배기량이 클수록 같은 거리 운행에 더 많은 연료를 사용한다. 자동차 배기가스 세금이 따로 있진 않지만 나름 공정하게 배기량에 따라 세금이 부과되고 있는 것이다. 가구당 요금에서 봉투로 바뀐 쓰레기 배출 역시 마찬가지다. 로그 정보에 대한 소유권 인정과 창출된 사회경제적 가치 공유는 자동차 배기가스, 쓰레기가 사회경제적 가치를 창출하고, 이에 세금 대신 보상금을 주는 관점이다. 로그 정보에 대한 소유권 인정과 보상은 획기적 기술로 자동차 배기가스가 양질의 산소가 배출된다거나 미세먼지와 오염물질을 연료 삼아 귀금속을 생성하게 됐을 때 산소배출량에 보상하고 귀금속을 기업이나 정부가 사주는 것과 같은 일이다. 분명한 것은 개인이 생성을 위해 별도의 노력을 하지 않지만, 개인으로 인해서 발생한 로그 정보를 활용 사회경제적 가치를 창출했다면 기여를 인정하고 기여분에 비례한 보상을 하는 것이 합리적이고, 공유경제 성장과 발전에 필요하다.

    아직 생성, 활용되고 있지 않지만 개인의 예정, 상황, 소유정보는 로그정보와 다르게 의지적인 지적활동의 결과물이고, 정보사회에 핵심이 될 자원이다. 정보혁명은 개인들에게 더 정확하고, 빠른 정보생성 동기와 기반을 제공하고, 생성된 정보를 사회경제적으로 가치 있게 활용하는 생태계 또는 플랫폼을 만들어가는 과정이다. 개인이 지적활동으로 생성한 정보에 대한 소유권을 인정하고 사회경제적 가치를 창출해 기여를 보상하는 것은 더 정확한 정보를 빠르게 지속적으로 생성, 활용하기 위한 필수적이고 기본적인 규범이다. 사적 소유권 인정과 기여에 비례한 보상 규범의 합리성, 생산성은 사적 소유를 부정하고, 기여가 아닌 평등한 보상을 지향한 공산주의 실패, 사적 소유권을 인정하고 능력에 따른 보상을 지향한 자본주의의 성공을 통해 증명되고 검증된 것이다.

댓글 남기기

%d