열린라디오 YTN
  • 방송시간 : [토] 20:20~21:00 / [일] 23:20~24:00 (재방)
  • 진행 : 최휘/ PD: 신동진 / 작가: 성지혜

인터뷰전문보기

[이슈!빅데이터]"빅데이터vs여론조사, 그 간극은?!"-배철순 소장 5/6(일)
작성자 : ytnradio
날짜 : 2018-05-08 16:25  | 조회 : 2857 
[YTN 라디오 ‘열린라디오YTN’]
■ 방송 : FM 94.5 MHz (20:20~20:56)
■ 방송일 : 2018년 5월 6일 (일요일)
■ 출연 : 배철순 하우사회문제연구소장

∘이슈!빅데이터 시간입니다. 빅데이터 분석을 통해 미디어에서 보여 진 사회현상의 의미를 짚어 보도록 하겠습니다. ‘빅데이터를 처형하라’의 저자이자, 하우사회문제연구소 소장이신 배철순 소장님을 모셨습니다. 소장님 안녕하세요.  

→ 네 안녕하세요. 

∘소장님 평양냉면 드셨습니까? 냉면 관련해서 따로 기고할 정도로, 많이 좋아하시는 걸로 알고 있는데 왠지 드셨을 것 같습니다.    

→ 네. 저는 정말 평양냉면을 좋아합니다. 남북정상회담이 이루어진 지난 주, 평양냉면 팬들이 엄청나게 늘었을 것 같습니다. 저도 옥류관 냉면 먹어 보는 것이 평생소원 중 하나인데요. 정상회담만찬을 보면서 아쉬움을 달래려고 단골집을 찾았는데, 정말 너무 많은 분들이 오셔서 발걸음을 돌려야만 했습니다.   

∘많은 분들이 평양냉면 먹은 것을 소셜 미디어에 인증한 것을 볼 수 있었습니다. 남북정상회담의 여파가 정말 대단했던 것 같습니다. 

→ 그렇습니다. 네이버 데이터랩 빅데이터입니다. 4월 26일 목요일부터 ‘남북정상회담 시간’과 같은 검색어가 급상승 검색어에 노출되기 시작했습니다. 4월 27일 금요일, 당일에는 ‘남북정상회담 생중계’, ‘판문점’, ‘김정은’ 등을 비롯해서 YTN, KBS, MBC, SBS, JTBC와 같은 언론사, 키워드 ‘온에어’와 같이 역사적인 순간을 지켜보고자 하는 네티즌들이 많았다는 것을 알 수 있었습니다. 이후 4월 28일 토요일에는 ‘홍준표’, ‘나경원’과 같이 보수야당의 인물들이 ‘남북정상회담’ 결과에 대한 비판적인 발언으로 상당기간 급상승 검색어에 머물렀습니다. 

∘그렇군요. 대단한 국민적 관심이 아니었나 생각됩니다. 또 다른 이슈가 있었을까요?

→ 대한항공의 ‘갑질 자매’ 사건이 ‘갑질 모녀’사건으로, 이제는 ‘갑질 밀수, 갑질 탈세’ 사건으로 끝없이 확장되고 있습니다. 지난 방송에서 이미 말씀드린 바 있지만, ‘투명해진 우리사회’에서 ‘영원한 비밀’은 없습니다. 옳지 않은 일을 해서는 안 된다는 말이지요. 하나씩 폭로되는 조양호 회장 일가의 충격적인 갑질들로 인해서 지난 주간 내내 ‘대한항공’, ‘조양호 회장’, ‘이명희 여사’, ‘조현아’, ‘조현민’ 등의 이름이 네이버 실시간 급상승 검색어에 오르내렸습니다. 또 ‘조현아’ 전 대한항공 부사장이 결혼 8년 만에 이혼소송을 벌이고 있다는 소식이 전해지기도 했습니다. 

∘언론인으로서 사회 곳곳에 만연한 ‘옳지 않은 일’들을 바로잡기 위해 더 열심히 일해야겠다는 생각을 가져봅니다. 소장님, 그럼 이번 주 주제는 어떤 것을 선택하셨을까요? 역시 ‘남북정상회담’ 아닐까 생각해봅니다. 

→ 네. ‘남북정상회담’ 이슈만큼 큰 이슈가 더 있겠습니까. 보수야당의 지적처럼 지난 경과가 결코 좋지는 않았습니다. 하지만, 통일은 반드시 이루어야할 숙제이고, 남북이 평화적인 대화를 나누는 것은 칭송받아 마땅한 일입니다. 그런 당연함 때문인지, 빅데이터 분석을 통해 다른 매체들이 이미 보도한 것과는 다른, 유의미한 차이를 찾기는 힘들었습니다. 조금 더 경과를 지켜보고 분석을 시도해 보려고 합니다.

∘그렇다면 어떤 주제를 선택하셨을까요?

→ 지난 주 주제가 ‘지방선거’에서 빅데이터 분석이 가지는 의미였다는 것 기억하시지요? 

∘그렇지요. “빅데이터 분석을 통해 당선자를 예측할 수는 있다. 다만, 한국 특유의 환경, 또 지방선거라는 한정적인 특성 때문에 어려움이 있다”라고 말씀하셨던 것 같습니다.

→ 역시 정확하십니다. 지난 주 방송이후에 많은 분들이 “더 궁금증이 생겼다”고 하시거나, 최 아나운서님처럼 “그래서 서울시장은 누가 된다는 거냐?”, “예측할 수 있다는 것이냐? 없다는 것이냐?”라고 의문의 말씀을 주셨습니다. 해서 이번 주제로는 ‘서울시장’을 선택해봤습니다.

∘드디어 소장님께서 부탁을 들어주셨네요. 정말 기대가 큽니다.

→ 예 들어보시면 실망 하실 지도 모릅니다. 트럼프의 당선을 예측했던 구글의 빅데이터 분석은 매우 간단하게 보입니다. 구글 트렌드에서 제공하는 빅데이터에 단순히 키워드 ‘트럼프’와 ‘힐러리’를 넣고, 관심도의 추세와 차이를 본 것이지요. 키워드 ‘문재인’과 ‘홍준표’를 넣었을 때 한정된 시간동안 키워드 ‘홍준표’에 더 높은 관심을 보였지만, 지속적으로 키워드 ‘문재인’이 더 많은 관심을 끌었고 결국 당선되었다는 말씀을 드린바 있습니다. 

∘그렇다면, 결정된 후보의 이름만 넣으면 되는 군요.

→ 네. 방송을 준비한 5월 4일 목요일 기준입니다. 더불어민주당의 서울시장 후보 ‘박원순’, 자유한국당의 ‘김문수’, 바른미래당의 ‘안철수’를 키워드로 구글트렌드 빅데이터에, 설정지역 ‘대한민국’, 기간 ‘지난 30일’, ‘모든 카테고리’의 ‘웹검색’으로 데이터를 추출해 봤습니다.

→ 구글이 제공하는 상대적 비교수치인 토털관심도에서 안철수 51, 박원순 27, 김문수 20이라는 수치를 먼저 볼 수 있습니다. 안철수 후보가 상당히 높은 수치를 보이고 있고, 시각화된 그래프 역시 김문수 후보의 출마선언일 전후로 약 2일간 역전된 것을 제외하고는 꾸준히 다른 후보들을 압도해 왔다는 것을 알 수 있습니다. 박원순 후보와 김문수 후보의 경우는 엎치락뒤치락 하고는 있지만 다소 박원순 후보가 높다는 것 역시 알 수 있었습니다.

∘그렇다면, 빅데이터에만 따른다면 안철수 후보가 서울시장이 된다는 것처럼 들립니다.

→ 그런 해석이 가능합니다. 제가 네이버 데이터랩의 빅데이터 역시 비슷한 과정을 거쳐봤는데요. 구글 만큼 뚜렷하지는 않았지만, 역시 안철수 후보가 압도적으로 높은 검색빈도를 보인다는 것을 알 수 있었습니다.

∘잘은 모르겠지만, 여론조사결과들과는 다소 차이가 있는 것 같습니다.

→ 언론사 뉴시스가 여론조사전문기관 리서치뷰에 의뢰해서 4월 13일부터 4월 14일까지 2일간 만 19세 이상 서울시민 1천명을 대상으로, 휴대전화 가상번호 50%, RDD유선전화 50%를 통해서, ARS 자동응답시스템으로 진행한 ‘서울시장 선거 3자대결’ 여론조사가 있습니다. 참고로 이 조사의 표본오차는 95%, 신뢰수준 ±3.1%, 응답률 2.9%입니다. 보다 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참고하시기 바랍니다.

→ 이 조사에서, 박원순 서울시장은 50.9%, 자유한국당 김문수 후보는 20.4%, 안철수 후보는 19.0%의 결과를 보이고 있습니다. 1위와는 확실히 거리가 있는 결과죠.

→ 사정이 이렇다보니 여론조사결과들과 유사한 결과가 나오는 일부지역에 경우에는 빅데이터 분석 운운하는 정치컨설턴트들이 많이 활동하고 있지만, 서울지역은 사실 매우 드물게 언급됩니다.

∘그렇겠군요. 빅데이터와 여론조사에서 큰 차이를 보이고 있군요. 뭘 믿어야할지 모르겠습니다.

→ 여기에 분석을 덧붙여보겠습니다. 대선후보였던 안철수 후보에 대한 관심도가 서울시장으로서의 지지여부를 떠나서 평소에도 다소 높을 수는 있을 것입니다. 지난 주간을 달구었고, 계속해서 이슈거리를 던져주고 있는 ‘드루킹 댓글조작 사건’의 진행과 지지율의 상승곡선이 일치한다는 점도 재미있습니다.

→ 안철수 후보자 본인이 페이스북을 통해 “악성댓글 여론조작은 고문보다 지독한 가혹행위다”라고 게시한바 있습니다. 드루킹 사건이 과거에 안후보자에게 미친 악 영항은 향후 수사경과를 봐야하겠지만, 적어도 지방선거 국면에서는 안철수 후보에 대한 네티즌 관심을 유도하는 것에 긍정적으로 기여한 것으로 보입니다. 

∘혼란스럽습니다.

→ 그렇습니다. 제가 빅데이터 신봉자이기는 하지만, 지금 이런 경우에는 확신을 가지기는 힘듭니다. 본래 거물급 후보에, 특정한 이슈가 발생했습니다. 우리나라의 환경적인 특성상 이미 많은 정보에 노출된 상태에서 검색 포털을 이용한 결과입니다. 더구나 포털의 접근은 전국적으로 이루어지지만, 투표권은 오롯이 서울시민에게만 주어지는 것입니다. 이런 다양한 변수들을 모두 아우르는 것은 사실상 불가능한 일입니다.

∘그렇군요.

→ 그리고 이런 혼란에는 미디어도 기여한다는 사실, 알고 계셔야합니다.

∘미디어가 빅데이터 예측을 막는다는 말씀이신가요?

→ 막는 다기 보다는 빅데이터의 생성에 영향을 미칠 수 있습니다. 유명인들에게 보도는 생명과 같은 것입니다. 보도되지 않는다면 일반인들의 관심은 당연히 적어질 것입니다. 관심이 적다면, 당연히 검색을 할 일도 없고, 관련 게시글을 작성할 이유도 없을 겁니다.

∘그렇군요.

→ 2016년 4월부터 한국언론재단은 뉴스 빅데이터 분석시스템인 빅카인즈(BIG kinds)를 운영하고 있습니다. 5월 4일 목요일 기준 키워드 ‘안철수’에 대한 빅카인즈 뉴스 검색결과는 총 1,519건입니다. ‘안철수’가 긍정적이든, 부정적이든 뉴스에 등장한 횟수를 의미합니다. 동일한 조건에서 키워드 ‘박원순’의 기사 언급횟수는 총 1,158건입니다. ‘김문수’후보는 어떨까요. 총 667건에 불과합니다.

∘묘하게 구글의 빅데이터 수치와 비율적으로 비슷한 것으로 보입니다.

→ 그렇습니다. 기사가 많이 되어야지 사람들이 많이 알고, 그래야 생성 데이터도 많아질 것입니다. 박원순 후보나 김문수 후보의 입장에서는 언론사에 야속한 마음을 가질 수 도 있을 겁니다. 그런 측면에서 언론의 힘은 지대합니다. 우리 열린라디오에서 늘 강조하는 공정함이 필요한 부분이지요.

→ 관련 이슈가 많았고, 이를 언론사가 많이 다루었기 때문에 발생되는 ‘여론조사 결과’와 ‘빅데이터 분석의 차이’, 무엇을 더 믿을지는 애청자분들의 선택이 아닐까 생각됩니다. 

∘아! 소장님 오늘 말씀을 듣고 보니, 더 혼란에 빠지는 것 같습니다. 서울시장 선거결과는 그냥 6월 13일 투표이후를 기다려야겠습니다. 남북정상회담으로 시작해 대한항공으로, 그리고 서울시장 당선자를 예측하는 빅데이터 분석, 그리고 분석의 한계점에 대한 좋은 말씀 들어봤습니다. 감사합니다. 소장님.

→ 네 감사합니다.

[저작권자(c) YTN radio 무단전재, 재배포 및 AI 데이터 활용 금지]
목록
  • 이시간 편성정보
  • 편성표보기
말벗서비스

YTN

앱소개