우리가 몰랐던 빅데이터의 모든 것

트위터에서는 하루 평균 1억 5천500만 건의 트윗이 생겨나고, 유튜브에서는 하루 평균 40억 회에 걸쳐 동영상이 재생된다. 또한, 전 세계 데이터 규모는 지난 2014년에 6.9제타바이트*였고, 올해는 7.9제타바이트로 그 규모가 증가할 것으로 보인다. 이러한 천문학적 규모의 데이터를 빅데이터라고 하는데, 최근 이 빅데이터에 대한 사회 각계의 관심이 뜨겁다. 빅데이터 양이 폭증함과 동시에 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 생각과 의견까지 분석하고 예측할 수 있기 때문이다. 이미 우리 삶 깊숙이 들어와 있는 빅데이터. 이의 순기능과 부작용을 중심으로 알아봤다.

모든 결과엔 원인이 있다

다이어트 시리얼 회사 광고제작팀 A씨는 ‘어떻게 하면 광고를 잘 만들 수 있을까’를 고민 하던 중, ‘최근 주목 받고 있는 빅데이터를 이용해 광고 계획을 세워야겠다’고 다짐했다. A씨는 다이어트와 관련된 단어를 몸매, 휴가, 온도로 정한 후 빅데이터 기술을 활용해 이 단어들 간의 상관관계를 분석했다. 분석 결과, 온도가 21℃가 되면 인터넷상에서 휴가에 대한 언급이 대폭 증가했고 휴가에 대한 언급이 오르자 비키니, 몸매에 대한 언급이 함께 오른 것을 볼 수 있었다. A씨는 이에 착안해 ‘온도가 21℃가 되는 시간대에 비키니를 입은 몸매 좋은 연예인을 모델로 내세워 광고를 제작해야겠다’고 생각했다.

위의 사례처럼 빅데이터를 이용하면 온도가 일정 수준 이상으로 증가할 때, 사람들이 다이어트의 욕구를 느낀 다는 것을 확률적으로 알 수 있다. 즉, 간단한 몇 가지의 정보만 있다면 빅데이터를 통해 미래에 대한 정교한 추측이 가능한 것이다.

빅데이터의 가장 큰 장점은 ‘수많은 형태의 정보가 쌓여 다양한 가치를 만들어낸다’는 데 있다. 이런 빅데이터를 가장 발 빠르게 활용하는 건 기업과 정치권이다. 기업들은 빅데이터를 이용해 소비자의 소비 패턴 속에서 ‘욕구’를 찾아내 신제품 개발이나 판매 전략에 활용한다. 정치권에선 ‘유권자 맞춤형 선거 전략’을 짜는 데 빅데이터를 활용할 수 있다. 최근 재선에 성공한 버락 오바마 미국 대통령 역시 유권자들의 다양한 정보를 이용해 만든 ‘유권자 지도’ 덕분에 최적의 선거 전략을 짤 수 있었다.

사회적으로 빅데이터는 재난·범죄·질병예방 등 공공행정 문제를 효율적으로 해결하는 데 일조한다. 실제로 미국 샌프란시스코는 ‘높은 지형에서 낮은 지형으로 갈수록 범죄 발생률이 높다’는 점을 파악해 경찰력을 배치하고 있으며, 우리나라 국민안전처는 빅데이터를 활용해 날씨를 미리 분석하고 재난 발생 시 긴급재난문자를 보내고 있다.


나보다 나를 잘 아는 빅데이터

이처럼 현대인은 빅데이터 덕분에 안갯속 같던 세상을 보다 구체적으로 예측할 수 있게 됐지만 이에 따른 부작용 역시 예상된다. 특히, 빅데이터가 활성화될수록 개인정보 침해 문제가 발생할 것이란 추측이다. 얼마 전 미국 중앙정보부(CIA) 국장에 대한 수사가 사생활 폭로로 이어진 것처럼 갈수록 공·사적 정보가 마구 뒤섞여 빅데이터를 독점한 개인이나 기업에 의해 악용될 소지가 있다. 김우주 교수(공과대·지능웹비즈니스)는 “빅데이터 사용이 확대될수록 우리의 일상 자체가 ‘감옥’이 될 수도 있다는 점을 명심해야 한다”며 우려를 표했다. 또한, 베를린예술대 철학과 한병철 교수는 저서  『피로사회』에서 ‘빅데이터야말로 심리정치의 가장 효율적인 도구’라며 ‘빅데이터는 우리 자신도 의식하지 못하는 습관과 행동패턴, 무의식적 욕망까지 읽어내 지배를 위한 지식으로 활용된다’고 말했다. 이는 빅데이터가 인간 자체를 양으로 환산하고, 측정하며, 조종할 수 있다는 경고로 해석될 수 있다.

각국에서는 이러한 빅데이터의 부작용을 최소화하기 위해 노력을 기울이고 있다. 대표적으로 일본의 경우, 빅데이터의 부작용을 예방하기 위한 관련법을 강화했다. 기업은 빅데이터 사용 항목을 공표할 의무가 부과되고, 이를 위반할 시 6개월 이하의 징역 또는 30만 엔(약 300만 원) 이하 벌금이 매겨진다. 그뿐만 아니라 고객정보를 부정한 방법으로 유출한 자의 처벌도 강화된다. 고객정보가 유출될 시 1년 이하 징역 또는 50만 엔(약 500만 원) 이하의 벌금에 처해진다.

우리나라도 빅데이터의 발전에 따라 개인정보보호법을 정비하고 있다. 아직 구체적인 대안은 나오지 않았지만 방송통신위원회와 미래창조과학부를 비롯해 여러 정당들은 개인정보보호법을 수정하는 등 빅데이터에 대한 가이드라인을 만들고 정비하고 있다.

빅데이터 전문가인 다음소프트 송길영 부사장은 “누군가는 불을 이용해 밥을 짓고, 누군가는 불을 질러 화재를 일으킨다. 여기서 불이라는 도구 자체에는 아무런 잘못이 없다. 데이터의 잘못된 활용으로 피해가 발생하는 상황도 마찬가지”라며 빅데이터를 불에 비유해 설명했다. 이어 송 부사장은 “데이터를 이용하는 사람의 윤리 의식의 문제”라며 “데이터를 어떻게 쓸 것인지 보편적 상식에 준거해 인지하는 것이 필요하다”고 덧붙였다.

빅데이터 기술은 전 세계의 경제·사회적 발전을 이끄는 동력으로 자리 잡았다. 하지만 이로 인해 나타나는 문제점도 적지 않다. 빅데이터 관련 개인정보 법률을 정비하되, 빅데이터를 이용하는 사람들의 윤리 의식 개선을 통해 바람직한 빅데이터 사용이 이뤄져야 할 것이다.

*제타바이트(zettabyte) : 디지털 정보 표시단위, 3MB 안팎의 MP3 곡을 약 281조 5천억 곡 저장할 수 있는 용량이다.


신준혁 기자
jhshin0930@yonsei.ac.kr
<자료사진 세계미래포럼>  

저작권자 © 연세춘추 무단전재 및 재배포 금지