열린라디오 YTN
  • 방송시간 : [토] 20:20~21:00 / [일] 23:20~24:00 (재방)
  • 진행 : 최휘/ PD: 신동진 / 작가: 성지혜

인터뷰전문보기

[이슈!빅데이터]"빅데이터로 선거를 말하다!"-배철순 소장 4/22(일)
작성자 : ytnradio
날짜 : 2018-04-23 17:14  | 조회 : 2814 
[YTN 라디오 ‘열린라디오YTN’]
■ 방송 : FM 94.5 MHz (20:20~20:56)
■ 방송일 : 2018년 4월 22일 (일요일)
■ 출연 : 배철순 하우사회문제연구소장


∘이슈!빅데이터 시간입니다. 빅데이터 분석을 통해 미디어에서 보여 진 사회현상의 의미를 짚어 보도록 하겠습니다. ‘빅데이터를 처형하라’의 저자이자, 하우사회문제연구소 소장이신 배철순 소장님을 모셨습니다. 소장님 안녕하세요.  

→ 네 안녕하세요. 

∘소장님 지난 방송에서 벚꽃축제 가실 거라고 다짐하셨는데, 잘 다녀오셨습니까?  

→ 네. 여의도 윤중로 벚꽃축제에 다녀왔습니다. 아 정말 사람이 너무 많아서, 꽃을 본건지 사람 구경을 한 건지 잘 모르겠습니다. 한 번 더 가봐야지 했는데, 비가 잠깐 내리더니 벌써 잎이 나버려서 올해는 상당히 짧게 꽃을 즐겼던 것 같습니다.

∘저도 뒤늦게 가봤는데, 꽃을 많이 보진 못했습니다. 미세먼지 때문에, 또 상당히 짧은 개화기간 때문에 조금 아쉬움이 남았던 것 같습니다. 지난 주간, 상당히 많은 이슈들이 있었던 것 같은데 짧게 정리해주시지요.

→ 그렇습니다. 아름다운 꽃도 있었지만, 다소 무거운 주제의 이슈들이 이어졌던 지난 주간이었습니다. 먼저 ‘갑질’에 대해서 언급하지 않을 수 없을 것 같습니다.

→ 경기도 남양주 다산신도시 이야기입니다. ‘차 없는 아파트’를 표방한 일부 아파트에서 택배차량 출입을 두고 택배회사와 주민간의 갈등이 있었고요, 결국 택배기사님들이 택배 배송을 거부했습니다. 아파트입구에 쌓여진 배송물 사진이 소셜미디어를 통해서 유포되어서 소위 ‘택배 갑질’ 논란이 일었습니다. 주민들의 선택은 이해하겠지만, 저임금에 시달리는 택배기사님들에게 과연 그렇게 까지 과잉서비스를 요구하는 것이 바른 일인지. 또 이를 해결하기 위해서 ‘실버택배’등 국민 세금을 투입하는 것이 옳은 것인가를 두고 큰 논란이 있었습니다.

∘저도 ‘실버택배’철회를 요청하는 국민 청원을 봤는데요. 20만명이 넘었더라고요.

→ 그렇습니다. 결국 택배사가 신청을 철회했지요. 또 있습니다. ‘대한항공’관련 갑질입니다. ‘갑질 기업’의 이미지가 조금 나아지는 가 했습니다만 다시 시작입니다. 조현민 대한항공 전무가 광고대행사 팀장에게 음료수 병을 던지고, 물을 뿌렸다는 폭로가 익명 게시판에 게시되어서 소위 ‘물벼락 갑질’ 논란이 있었습니다. 이분은 4년 전 ‘땅콩회항’의 주인공 조현아 전 대한항공 부사장의 동생입니다. 소위 ‘자매 갑질’에 대한 네티즌 분노가 상당했고, 어머니인 이명희 일우재단 이사장의 ‘폭언’과 ‘욕설’, ‘인사조치’, ‘폭행의혹’까지 제기되어서 “대한항공의 국적기 자격을 박탈해라”, “대한항공에서 ‘대한’자를 빼라”는 국민청원이 청와대 홈페이지에 제기된 상황입니다.

∘참 ‘갑질’ 논란 끊이지 않습니다. 그렇게 많은 질타를 받고, 또 많은 사회적 공감을 얻었음에도 아직도 남아있는 ‘갑질’들이 있는 것 같습니다. 속히 개선되기를 기대해 봅니다. 소장님. 정치권도 상당히 시끄러웠던 것 같습니다.

→ 그렇습니다. ‘김기식’ 금융감독원장이 임명 2주일여 만에 사퇴했습니다. ‘참여연대’ 창립인중 한명으로, 19대 총선에서 더불어민주당 비례대표로 국회활동을 하기도 했고요. ‘더미래연구소’의 소장으로 현 정부의 금융개혁 밑그림을 그리기도 했던 분입니다.

→ 관행이라고는 하지만, 국회의원 재직 당시 피감기관의 돈으로 해외여행, 외유를 즐겼다는 점, 해당 여행에서 여비서를 대동했고, 이 여비서가 초고속 승진을 했다는 점에서 큰 논란이 있었습니다. 또 정치자금 5천만원을 자신의 연구소에 셀프후원한 정황도 있었는데요, 논란이 커지자 문재인 대통령은 선관위의 위법판단이 나오면 사퇴시키겠다는 의견을 냈고, 결국 지난 16일 중앙선거관리위원회가 위법판단을 내려서 결국 사퇴하게 되었습니다.

∘도덕성을 강조한 ‘참여연대’라는 대표적 시민단체에서 활동하셨고, 평소 대기업의 ‘저승사자’라 불릴 만큼 남다른 이미지를 가졌던 분이라 많은 분들의 실망이 있지 않았나 생각해봅니다. 참 안타깝습니다.

→ 소위 ‘내로남불’, “내가하면 로맨스 남이하면 불륜”이라는 지적이 많이 관찰되었습니다. 또  금주를 뜨겁게 했던 이슈로 ‘드루킹 댓글조작 사건’관련 이야기도 빼놓을 수 없을 것 같습니다. ‘드루킹’이라는 아이디를 사용하는 정치 블로거이자, ‘경제적 공진화 모임’이라는 단체를 운영하는 대표자가 ‘댓글조작’, ‘공감, 비공감수 조작’, ‘조회 수 조작’ 등의 다양한 방법을 동원해서 선거 등에서 활동한 정황이 포착되어 수사 중입니다. 이런 사실만 하더라도 상당히 충격적인데, 더불어민주당의 유력한 경남도지사 후보로 꼽히는 김경수 국회의원과의 ‘인사청탁’과 관련된 내용이 확인되어서 논란이 계속되고 있습니다.

∘물론 사실관계는 경과를 조금 더 살펴봐야겠습니다. 정말 충격적인 일인 것 같습니다. 소장님 그럼 이번 방송 주제는 어떤 것을 선택하셨을까요. ‘갑질’에 대해서는 지난 방송에 다룬 적이 있으시고, 정치관련 주제는 잘 다루지 않으시는데. 

→ 예 말씀하셨다시피 저희 프로그램이 1년여가 되다 보니 반복되는 이슈들은 많이 다뤘습니다. 그래서 다시 다루기에 어려움이 있고요. 정치관련 주제는 제가 피한다기보다는 사실관계 확인이 어렵고, 인명이 많이 등장한다는 점에서 빅데이터 분석을 하기에 어려움이 있습니다.

→ 금주 주제는 근래 가장 많이 검색되는 키워드 ‘지방선거’를 준비해 봤는데요. 지방선거에 대한 ‘빅데이터 분석’, ‘빅데이터 예측’이 가지는 특징과 맹점을 지적해보고자 합니다.

∘상당히 재미있을 것 같습니다. 누가 당선될지를 예측한다는 말씀이신건가요?

→ 그런 의미는 아닙니다. 최근 개인적으로 “빅데이터를 사용해서 선거를 예측할 수 있는가?”라는 인터뷰를 많이 받았습니다. 또 일부 매체나 정치컨설턴트들이 빅데이터로 지방선거 결과를 예측하는 보도나 기고, 마케팅을 하고 있습니다. 이런 내용을 이해하시는데 도움이 되는 정보를 조금 드리고자 합니다.

∘아쉬운데요. 저는 서울시장이 어떤 분이 되실지 무척 궁금했습니다. 

→ 죄송합니다. 하지만 최 아나운서님처럼 ‘미래’를 예측하고자 하는 것은 인간의 본능입니다. 미래를 알게 되는 것은 큰 이익을 주기 때문이지요. 서울시의 경우에도 교통, 안전과 같은 분야에서 이미 빅데이터를 활용해서 미래를 예측하고 대비하고 있습니다. 예를 들면 범죄우발지역, 사고예상지역 같은 경우에 사전에 대처하는 것 같은 행위에 사용되지요. 

→ 키워드 ‘지방선거’에 대한 지난 한 달간의 구글트렌드 빅데이터 결과역시 이런 욕망을 반영합니다. 가장 많은 빈도의 연관어는 ‘지방선거 여론조사’입니다. 여론조사는 결국 당선자를 예측하기 위해서 하는 행위지요. 

∘그렇군요. 그런데 여론조사보다 빅데이터가 더 정확한 것 아닌가요?

→ 선거에 있어서 당선을 예측하는 일, 특히 선거결과를 대부분의 전통적인 미디어와 여론조사기관들이 결과를 잘못 예측했던 지난 2017년 트럼프-힐러리 대선을 지켜보셨던 많은 분들이 그렇게 생각하실 것 같습니다. 대부분이 힐러리의 승리를 점쳤지만, 구글은 빅데이터를 기반으로 트럼프의 승리를 예측했던 바가 있습니다. 이것이 큰 인상을 줬었지요.

→ 여론조사가 빅데이터보다 못하다는 말은 조금 해석이 필요합니다. 여론조사의 샘플수가 모수, 그러니까 조사대상 전체수에 가깝게 늘어난다면 그 여론조사의 신뢰도는 상당히 높아질 것입니다. 바로 절대적인 데이터량의 증가, 빅데이터와 매우 유사한 의미입니다.

→ 물론 빅데이터는 그러한 절대적 수 자체를 넘어서는 큰 내용을 의미합니다. 또 평소의 생활태도, 학력, 경제력 등 여론조사처럼 직접 질문에 답하는 것이 아니라, 자신도 모르는 자신의 행동을 예측할 수 있는 정보를 제공한다는 점에서 또 다릅니다.

→ 여론조사는 이틀정도, 빅데이터와 비교해서 매우 저렴한 비용으로 미래예측에 도움이 되는 정보를 얻을 수 있습니다. 빅데이터로 결과를 얻어내는 것은 더큰 비용과 시간이 필요하겠지요. 기술도 필요하고 분석능력도 요구될 겁니다. 

∘소장님 말씀을 들어보니 물리적, 시간적 제한이 없다면, 특정한 경우에는 여론조사가, 대부분의 경우에는 빅데이터가 더 정확할 수 있다는 말씀 같습니다.

→ 예, 그런 해석이 가능합니다. 구글이 트럼프 대통령의 당선을 예측한 것은 구글트렌드 빅데이터에서 제공하는 ‘관심도의 차이’ 때문이었습니다. 상당히 간단한데요. 키워드 ‘트럼프’를 검색된 빈도가 꾸준히 ‘힐러리’ 보다 높았고, 선거직전까지도 이런 추세가 유지되었다는 것입니다. 2016년 6월 영국의 EU탈퇴, 브렉시트 국민투표가 있었습니다. 사전 여론조사에서는 반대가 많았습니다. 하지만, 결과는 찬성으로 나타났습니다. 이때도 빅데이터는 결과를 미리 예측했지요. 

∘역시 빅데이터의 힘이네요. 그럼 우리 대선에서는 어땠을까요?

→ 예 지난 대선에서도 문재인, 홍준표 두 후보 간에 빅데이터 관심도를 두고 설전이 있었습니다. 본인이 더 높은 관심도를 얻었다는 주장이었는데요. 특정 기간에 홍준표 후보가 더 높은 관심도를 얻은 것은 사실입니다만, 다만 꾸준히 문재인 후보가 더 높은 관심도를 얻은 추세를 보인 것은 확실합니다. 즉 일시적인 차이는 있었지만, 결국 문재인 후보가 당선되었습니다.

∘아! 그럼 이번 지방선거에서도 적용이 가능하겠네요.

→ 예 그런 주장을 하시는 분들이 있습니다만 저는 조금은 부정적으로 생각하고 있습니다.

∘왜 그러실까요?

→ 이해진 네이버 의장이 작년 국정감사에 출석해서 “네이버는 현재 대한민국의 70%를 점유하고 있다. 점점 구글에 밀리고 있다”고 주장했습니다. 약간 엄살이 섞인 발언이라고 봅니다만 여하튼 구글이라는 특정 포털을 이용하는 사용자 층이 그렇게 많지는 않습니다. 우리나라, 러시아, 중국, 일본을 제외한 대부분의 국가에서 구글은 독점적 지위를 가집니다. 그렇지만 그렇지 못한 국가에서는 30%, 일부지요. 편향적인 사용자층을 가지고 있다는 점입니다. 예를 들어 저는 가끔 구글을 사용하지만, 제 가족들은 전혀 구글을 사용하지 않습니다. 아예 들어가 보질 않지요.

∘그렇겠군요. 그럼 네이버의 결과를 보면 되지 않을까요?

→ 네 네이버데이터랩에서도 검색어 트렌드라는 이름으로 유사한 정보를 제공하고 있습니다. 그런데 동일한 키워드에 대해서 구글과 비교해서 상당한 차이가 있는 그래프 모양을 볼 수 있습니다. 즉, 이 둘을 함께 생각하기에는 어렵다는 판단입니다.

→ 지방선거라는 지역적 이슈로 가면 더 많은 문제가 있습니다. 트럼프와 힐러리, 문재인과 홍준표는 전국적인 인물입니다. 충분히 많은 검색들이 이루어지고 인구분포적으로 고른  빅데이터를 형성할 것입니다. 그런데, 마포구청장은 어떨까요. 마포구의 유권자들에게 충분한 검색량을 확보하고 있을까요. 이것을 빅데이터라고 부를 수 있을까요. 또 대형 포털사는 그런 지역한정 서비스를 제공하고 있을까요. 그렇지 않습니다. 또 있습니다. 한국과 같이 동명이인이 많은 나라에서, ‘박영선’은 정치인일까요 아니면 영화배우일까요. 이름이 같다면 포털에서 쉽게 노출되기 힘들다는 것 잘 알고 계실 겁니다.

∘그렇지요. 지역선거와 같이 대선과 비교해 특정지역의 소수의 유권자를 대상으로 데이터를 수집하는 것은 양적으로 문제가 있을 수 있겠습니다.

→ 환경적인 문제점도 있습니다. 구글의 경우, 현재 모바일버전은 얼마 전 부터 뉴스서비스가 제공되고는 있는데요. 웹버전의 경우에는 정말 깔끔한 검색창 하나만 보입니다. 반면 네이버는 어떨까요. 수많은 뉴스, 실시간 검색어와 같은 정보들이 함께합니다. 즉, 정말 궁금해서 하얀 백지에 트럼프를 처 보는 미국유권자들과, 뉴스의 홍수 속에서 다른 텍스트를 지켜보면서 검색하는 한국유권자들은 다를 수밖에 없다는 결론입니다.

∘뉴스나 실시간 검색어에 영향을 받을 수 있겠군요.

→ 그렇습니다. 지금까지 말씀드린 것은 양대 포털사의 경우고요. 이제 소셜미디어로 가면 더 부정확합니다. 소셜미디어 빅데이터는 키워드를 지정하고, 크롤링(crawling)이라 부르는 일종의 검색을 통해서 수집됩니다. 즉, 비공개계정은 아예 조사대상이 되지 않는 다는 것입니다. 사용자가 극감한 트위터, 일부댓글, 공개된 블로그, 공개된 인스타그램, 일부 뉴스사, 일부 커뮤니티에서만 수집된 결과가 과연 유권자 전체를 아우를 수 있을지는 조금 생각해봐야할 것 같습니다.

∘감사합니다. 지난주간의 주요이슈들, 지방선거 결과를 예측하는 빅데이터 분석이 가지는 특징과 한계점에 대한 좋은 말씀 들어 봤습니다. 소장님. 선거 기간이 아직 많이 남았는데요. 다음엔 지역과 후보를 선정해서, 직접 빅데이터 분석을 해봐도 괜찮을 것 같습니다. 감사합니다.

→ 네 감사합니다.

[저작권자(c) YTN radio 무단전재, 재배포 및 AI 데이터 활용 금지]
목록
  • 이시간 편성정보
  • 편성표보기
말벗서비스

YTN

앱소개