기업에서 독점하는 데이터, 개인의 소유권 보장해야

네이버, 인스타그램, 구글맵을 이용하면서 한 번쯤 이런 의문이 들었을 것이다. “돈 벌려는 기업이 왜 무료로 서비스를 제공하지?” 기업은 결코 무료로 서비스를 제공하지 않는다. 사람들이 포털에서 검색하고 SNS에 게시글을 올리는 매 순간 기업은 돈을 번다. 실시간으로 수집되는 소비자의 데이터가 막대한 수익으로 돌아오기 때문이다.

 

지구 곳곳에서 내 데이터는 ‘열일’ 하는 중!

 

인터넷에 접속하는 순간 소비자는 광고에 둘러싸인다. 영상을 보기 전에 나오는 짤막한 광고부터 기사나 블로그 위아래 캡션까지, 수많은 광고에 노출된다. 놀라운 점은 광고가 소비자를 정확히 겨냥한다는 점이다. 대학생 A(22)씨는 “기사 배너에 최근 검색한 신발 광고가 떠서 놀란 기억이 있다”며 “블로그에 들어가면 현재 사는 동네의 카페광고가 떠서 찝찝했다”고 털어놓았다.

이런 맞춤형 광고가 가능한 이유는 기업이 소비자의 데이터를 수집하고 분석하기 때문이다. 기업은 등록된 소비자의 개인정보뿐 아니라 검색기록과 작성한 게시글을 통해 취향을 분석한다.


기업의 데이터 활용은 빅데이터 알고리즘을 통해 구현된다. 빅데이터 알고리즘의 대표적인 유형은 협업 필터링 시스템이다. 협업 필터링 시스템은 기존 소비자로부터 누적된 데이터를 새로운 소비자에 대입해 분석하는 방법이다. 넷플릭스의 취향저격 콘텐츠가 대표적인 사례다. 넷플릭스는 새로운 소비자의 취향을 분석해 비슷한 취향을 지닌 기존 소비자가 시청했던 콘텐츠를 제공한다. 소비자는 기업에 서비스 이용료뿐만 아니라 서비스 연료까지 제공하는 셈이다.


기업은 자체 서비스뿐 아니라 맞춤형 광고를 통해 이윤을 창출한다. 미국 경제학자 로버트 샤피로의 보고서에 따르면 지난 2018년 구글, 페이스북 등 거대 플랫폼 기업이 맞춤형 광고로 벌어들인 수익은 약 88조 원에 달한다. 우리대학교 강정한 교수(사과대·수리사회학)는 “소비자는 기업에 제공하는 자신의 데이터가 무료라 여기지만 사실 기업이 대량의 데이터를 축적하고 활용하면 그 가치는 어마어마하다”고 전했다.


빅데이터 활용은 광고에 국한되지 않는다. 기업이 수집하는 데이터는 분야를 가리지 않고 새로운 기술과 서비스를 연구하는 모든 곳에 활용된다. AI, 3D 프린터, 사물인터넷뿐만 아니라 일상생활에서 찾아볼 수 있는 퍼스널모빌리티까지 전부 기업이 수집한 빅데이터의 산물이다.

 

내 데이터, 왜 기업 마음대로 써?

 

기업에는 황금알을 낳는 거위처럼 여겨지는 빅데이터가 소비자는 달갑지 않다. ▲개인정보 제공 과정 ▲개인정보 침해 우려 ▲기업의 이윤 독점이 문제로 제기된다.


먼저 소비자는 자신의 데이터 수집 범위와 사용처를 정확히 알 수 없다. 지난 2018년 소프트웨어 회사 베리타스테크놀리지스가 국내 소비자 1천 명을 대상으로 한 조사에서 응답자 53%가 기업이 개인정보를 어떻게 사용하고 공유하는지 전혀 알지 못해 걱정된다고 답했다. 이에 개인의 데이터 자기 결정권을 강화해야 한다는 의견이 제기된다. 참여연대 이지은 간사는 “현재 개인의 데이터 자기 결정권은 보호받지 못하고 있다”며 “내 정보가 어디서 어떻게 쓰이고 있는지 알 수 없는 한국에서 데이터 자기 결정권은 허울뿐”이라고 지적했다. 기업이 개인정보를 불법으로 활용했음을 밝혀내도 처벌하기 어렵다. 과태료, 과징금 등 행정 제재의 수위가 약하기 때문이다. 이 간사는 “기업이 개인정보를 유출하거나 악용했을 때 소비자들이 사후구제 받을 수 있도록 집단소송제, 징벌적 배상제를 도입해야 한다”고 말했다.


한편 빅데이터가 개인의 민감한 정보를 유출할 수 있다는 우려도 있다. 빅데이터가 개인을 식별할 수 있는 특정 정보와 결합하면 딥데이터(deep data)로 진화할 수 있다. 불특정 다수의 정보를 무차별적으로 수집하는 빅데이터와 달리 딥데이터는 특정 개인에 관련한 구체적인 정보를 말한다. 예를 들어 한 소비자가 쇼핑몰에서 의료기기를 샀다고 가정하자. 해당 결제 내용은 오직 쇼핑몰만 알 수 있다. 그러나 쇼핑몰이 해당 결제 정보와 함께 소비자의 핸드폰 번호를 타인에게 판다면 상황이 달라진다. 핸드폰 번호로 소비자를 특정 개인으로 식별할 수 있게 되면서 이후 해당 소비자가 인터넷에 접속하면 의료기기 관련 광고가 뜰 확률이 높다. 정보 간 결합이 용이해질수록 빅데이터를 이용해 개인을 식별하기 쉬워지고 민감한 개인정보가 유출될 위험이 커진다.


마지막으로 데이터 활용으로 창출되는 이윤을 기업에서 독점하는 것이 문제라는 지적도 제기된다. 기업은 데이터를 이용해 천문학적인 금액을 버는 데 비해 정작 데이터 생산 주체인 소비자는 어떠한 대가도 돌려받을 수 없기 때문이다. 리서치 업체 위키본(Wikibon)에 따르면 전 세계 빅데이터 시장 매출은 지난 2018년 420억 달러 규모였고 오는 2027년에 1천30억 달러까지 성장할 것으로 전망된다. 해외 컨설팅 기업 뉴밴티지 파트너스(New Vantage Partners)에서 57개 기업에 진행한 조사에 따르면 2018년 빅데이터 활용을 통해 비용 절감에 성공했다고 응답한 기업은 49.2%에 달했다.


개인정보위원회에 따르면 지난 2016년 개인정보 유출 피해를 당한 적 있는 응답자는 2천 명 중 49.9%에 달하는 것으로 나타났다. 개인정보 유출 및 악용으로 인해 소비자가 입는 피해는 상당하다. 경제정의실천시민연합 윤철한 국장은 “보이스피싱 등 개인정보 유출로 인해 개인이 입는 피해는 심각하다”고 말했다.


이에 데이터로 창출된 부가가치를 데이터 소유자에게 돌려줘야 한다는 주장이 제기된다. 대표적인 논의가 데이터 기본소득이다. 미국 대선 출마를 선언했던 앤드루 양(Andrew Yang)은 지난 2019년 대선 공약으로 모든 미국인에게 매달 1천 달러(한화 약 124만 원) 지급을 약속했다. 기업에 데이터 이용세를 부과하겠다는 것이다.


기업에 데이터를 제공하는 개인의 행위를 ‘노동’으로 정의하는 시각도 존재한다. 개인이 데이터를 생산하는 행위가 노동이고 마땅한 보상을 지급해야 한다는 것이다. 강 교수는 “데이터 기본소득 지급을 위해 기업에 세금을 부과하려면 일단 데이터가 기업의 소유라는 전제가 수반된다”며 “반면 개인의 데이터 생산 노동에 대한 보상 지급은 데이터를 노동자의 노동 산물로 보기 때문에 데이터 소유권을 개인에게 돌리기 더 유리하다”고 말했다고 말했다.

 

‘데이터 3법 개정안’
데이터 소유권 사실상 기업에

 

그러나 우리나라 입법은 개인의 데이터 소유권 보장과 상반되는 방향으로 진행됐다. 지난 1월 ‘데이터 3법 개정안’(아래 데이터3법)이 국회 본회의를 통과했다. 이로써 기업이 개인의 동의를 얻지 않고 가명 정보를 이윤 목적으로 사용할 법적 근거가 마련됐다. 가명 정보는 개인정보 중 이름, 주소, 전화번호 등 개인을 식별할 수 있는 정보를 제거‧가공한 것이다. 기업은 가명처리만 하면 개인정보를 소유자의 동의 없이 활용할 수 있다.


산업계는 데이터3법 통과를 환영한다. 빅데이터, AI 기술 개발에 필요한 개인정보를 손쉽게 얻을 수 있기 때문이다. 전문기관을 통해 기업끼리 가명 정보를 거래하면 빅데이터를 이용한 신산업 발달이 가능해진다. 예를 들어 금융회사는 고객의 비금융 정보를 확보해 맞춤형 상품을 제공하는 등 새로운 서비스를 개발할 수 있다. 개인정보가 목적 외로 사용될 수 있다는 우려에 대해서도, 개인을 식별할 수 없도록 가명 처리하기 때문에 안전하다는 입장이다.


반면 참여연대, 경제정의실천연합을 포함한 15개 시민단체는 데이터3법이 정부와 기업이 합세해 통과시킨 ‘데이터 도둑법’이라 비판한다. 이 간사는 “데이터 소유자의 일거수일투족을 수집해 산업, 마케팅 등 기업의 이윤을 위해 활용하겠다는 것”이라며 “당연히 개인에게 비용을 지불해야 하는데 시간과 인력이 드니 그냥 이용하게 해달라는 것이 산업계의 주장”이라고 지적했다.


시민들은 가명 정보의 보안성을 두고 우려의 목소리를 낸다. 데이터3법은 가명 정보의 결합을 허용하는데 추가 정보가 있다면 가명 정보로도 개인을 식별할 수 있다. 경제정의실천시민연합 윤철한 국장은 “개인에 대한 유일무이한 정보는 가명 처리해도 의미가 없다”며 “가령 주민등록번호는 개인에게 부여되는 고유번호기 때문에 주민등록번호만 알면 개인을 손쉽게 유추할 수 있다”고 지적했다.


한편 개인의 데이터 소유권을 보장하기 위한 시도도 계속된다. 미래통합당 김세연 의원이 발의한 민법 개정안이 대표적이다. 해당 법안은 개인정보에 재산권을 부여하는 것을 골자로 한다. 민법 개정이 이뤄질 경우 기업은 기술개발을 위한 데이터를 수집하려면 개인으로부터 정보를 사들여야 한다.


그러나 이는 지나치게 시장주의적인 접근이라는 비판도 제기된다. 윤 국장은 “데이터에 대한 재산권을 인정하면 홍채 정보와 같은 개인정보도 무분별하게 거래될 수 있다”며 “입법하려면 개인정보를 시장에서 거래하는 것이 바람직한지에 대한 사회적 논의가 선행될 필요가 있다”고 말했다.

 

 

빅데이터는 4차산업혁명을 이끌 주요 원동력이자 논란의 중심이다. 빅데이터가 유의미한 기술개발로 나아가려면 개인정보가 보호되고 기업과 소비자 사이 공평한 이윤 분배가 전제돼야 한다. 데이터 소유권에 관한 사회적 합의가 선행돼야 하는 이유다.

 

 

글 민소정 기자
socio_jeong@yonsei.ac.kr
박준영 기자​​​​​​​
 jun0267@yonsei.ac.kr
 

 
저작권자 © 연세춘추 무단전재 및 재배포 금지