열린라디오 YTN
  • 방송시간 : [토] 20:20~21:00 / [일] 23:20~24:00 (재방)
  • 진행 : 최휘/ PD: 신동진 / 작가: 성지혜

인터뷰전문보기

[이슈!빅데이터]"빅데이터의 특성과 활용"-배철순 소장 10/8(일)
작성자 : ytnradio
날짜 : 2017-10-13 17:11  | 조회 : 4697 
∘이슈! 빅데이터 시간입니다. 빅데이터 분석을 통해 미디어에서 보여 진 사회현상의 의미를 짚어 보도록 하겠습니다. ‘빅데이터를 처형하라’의 저자이자, 하우사회문제연구소 소장이신 배철순 소장님을 모셨습니다. 안녕하세요 소장님.

→ 네 안녕하세요.

∘오늘은 조금 특별한 내용을 준비하셨다고 들었는데요

→ 네 본래 우리 방송이 지난 2주간의 이슈와 관련된 데이터 분석, 그리고 미디어 비평을 하는 시간인데요. 이번 추석연휴가 예년과 달리 한주가 넘는 긴 기간이고, 또 방송을 들으시는 시점이 딱 연휴 말미라 조금이나마 귀경에 도움이 되는 내용으로 구성해 봤습니다.

∘어떤 내용일까요?

→ 최 아나운서님은 네비게이션 사용하십니까?

∘그럼요. 스마트폰에 어플리케이션으로 깔린 네비게이션을 사용하고 있습니다.

→ 혹시 네비게이션에 빅데이터 기술이 사용되고 있다는 사실을 알고 계셨을까요?

∘아마도... 그럴 것이라고 생각은 됩니다만, 정확히 정리는 되지 않네요.

→ 네, 이번 방송에서는 교통정보, 교통시스템에서 어떻게 ‘빅 데이터’가 사용되는지, ‘빅 데이터’는 무엇인지에 대한 간단한 이해를 덧붙여서 말씀드릴까 합니다.

∘‘빅 데이터’ 많이 이야기들 하지만, 사실은 정확히 이해가 되지는 않는, 조금은 어려운 기술용어 같습니다.

→ 제가 빅데이터 관련 강의를 하면 먼저 이야기 드리는 세 가지가 있는데요. 첫째로, 빅데이터라는 기술이 아주 특별한 발견이라고 말하기 어렵다는 것을 가장 먼저 말씀드립니다. 그전에도 많은 데이터들이, 또 데이터 분석기술들이 우리 삶의 편리를 위해 존재해 왔다는 점을 말씀드리고요. 두 번째는, 그렇기 때문에 이미, 우리 생활 곳곳에서 ‘빅 데이터’라는 개념이 많이 사용되고 있다는 사실도 말씀드립니다. 세 번째는 단지 데이터로만 존재하며 활용되지 못했던 데이터들이 그냥 쌓여만 있는 것이 아니라 가치를 가지고, 활용될 수 있도록, 분석될 수 있도록, 기술 환경이 많이 발달되었다는 점을 강조합니다.

∘그렇군요. “특별하지 않다”, “이미 사용하고 있다”는 말씀을 하시니 부담감이 조금 덜한 것 같습니다.

→ 조금 전문적인 말씀드려보겠습니다. ‘빅 데이터’를 설명할 때 3V(쓰리-브이), V가 3개입니다. 3V(쓰리-브이)의 특성을 가지고 있다는 이야기가 빠지지 않습니다. V는 영어단어의 앞글자만 딴 것인데요. 데이터의 크기를 말하는 Volume(볼륨), 데이터의 다양성을 말하는 Variety(버라이어티), 데이터가 생성되고, 저장되고, 처리되는 속도를 말하는 Velocity(벌라서티)가 중심적으로 언급됩니다. 3V(쓰리-브이)외에도 다양한 특성들이 있지만 결국은 압도적인 데이터량을 의미하는 Volume(볼륨)에서 대부분의 특성이 기인된다고 보셔도 좋겠습니다. 그러니까 ‘빅 데이터’는 크다는 의미의 빅(Big)과 데이터 그 자체, 또 이것을 처리하는 과정과 기술, 분석된 결과 모두를 의미하는 포괄적인 의미입니다.

∘요약하자면 데이터의 절대량이 가져오는 특성이라는 말씀이시네요.

→ 그렇습니다. 그럼 ‘교통’이라는 특정한 분야에는 어떤 데이터들이 있을까요? 대중교통을 이용한다면 교통카드 데이터가 있겠네요. 차량의 하이패스 단말기 정보는 어떨까요. 경찰이 제공하는 실시간 교통정보 역시 좋은 데이터가 될 겁니다. 이미 많은 언론보도를 통해 알고계시지만, 특정장소, 특정시점의 휴대폰 통화이력(기지국 정보), 신용카드 결제정보, 택시 결제정보 등은 서울시의 심야버스 노선결정에 큰 기여를 했습니다.

→ 말씀드린 것처럼. 영상, 로그(log), 통화량, 결제정보와 같은 다양한, 버라이어티(Variety)한, 데이터들이 모여서 교통 빅데이터를 형성합니다. 최 아나운서님이 사용하고 계신 네비게이션 앱은 더욱 결정적인 빅데이터입니다. GPS이동정보, 경로, 속도, 목적지 등의 데이터를 실시간으로 확보할 수 있겠지요. 설문조사에 따르면 이번 추석 연휴에 ‘차량’으로 이동하는 사람이 10명중에 7명이라고 합니다. 보통 장거리 이동을 한다고 가정했을 때 네비게이션에서 발생되는 데이터의 양, 볼륨(Volume)은, 또 데이터 생성속도, 벌라서티(Velocity)는 인간의 이지로 가늠하기 힘든 수준일 것입니다. 최근에는 더 나아가 차량에 장착된 전자장치들을 통해서 ‘운행기록’, ‘부품의 상태정보’까지도 데이터로 수집되고 있습니다.

∘아! 이해가 됩니다. 교통이라는 한정된 분야에서도 ‘다양한 데이터’들이 ‘엄청난 양’으로, 또 ‘실시간의 속도’로 생성되고 있군요.

→ 그렇습니다. 그런데 이러한 데이터들은 갑자기 생겨난 것이 아닙니다. 오래전부터 꾸준히, 지속적으로, 하나의 서비스를 통해 제공되던 아주 익숙한 데이터들입니다. 다만, 과거에는 그 데이터들이 단순한 통계상의 수치로, 혹은 한정된 분야에서만 활용되어왔다면, 빅데이터의 시대에서는 이 모든 데이터들을 하나로 모아 연결(Join)할 수 있고, 빠른 속도로 분석할 수 있다는 것입니다. 이것은 놀라운 ‘신기술’의 탄생이라기보다는 ‘클라우드 컴퓨팅(Cloud Computing)’ 같은 데이터 저장 기술과 ‘스마트폰’, ‘네비게이션’과 같은 각종 ‘센서(sensor)’가 부착된 기기의 보급, 또 분산처리 기술의 개발 등이 함께한 종합적인 결과물입니다.

∘앞서 이야기하신 “빅 데이터가 특별한 발견이 아니다”라는 말씀이 이해가 되는군요.

→ 교통 빅데이터를 생성 시점에 따라 구분해보겠습니다. 수년간, 수십 년간 누적된 과거의 교통 데이터들이 있습니다. 아주 충분한 수의 과거 패턴입니다. 그리고 각종 스마트 기기의 보급으로 수집되는 엄청난 양의 실시간 데이터들도 있습니다. 바로 운행하고 있는, 현재의 교통상황을 말하고 있는 데이터입니다. 이 둘을 비교해서 분석하면 “미래에 발생될 교통현상에 대한 예측이 가능할 것이다”라는 것은 쉽게 이해하실 수 있을 것입니다.

∘그렇군요.

→ 지난 9월 4일 국토교통부와 한국교통연구원이 공공부문의 교통량 빅데이터와 민간의 네비게이션 빅데이터를 융합해서, 교통량 자료가 수집되지 않는 도로까지 교통량을 추정하는 기술을 개발했다고 발표했습니다. 기존의 현장조사를 통한 방법으로는 ‘전국도로대비 교통량 수집량’이 3%에 불과했는데요. 이 빅데이터 처리기술을 통해서 전국 95% 도로의 교통량을 확인할 수 있게 되었다고 합니다. 뿐만 아니라 시간과 예산도 대폭 줄이면서 기존에 조사가 불가능했던 ‘이면 도로’나 ‘교차로의 방향별 교통량’까지 확인할 수 있다고 하니 정말 획기적인 기술이 아닐 수 없습니다.

∘3%에서 95%라니 정말 대단한 일이네요. 정말 ‘빅데이터’라는 기술이 대단한 것 같습니다.

→ 그렇습니다. ‘빅 데이터는 4차 산업 혁명시대, 21세기의 원유’라는 비유가 있습니다. 그만큼 필수적이고, 큰 가치를 가지고 있으며 다양한 분야의 활용이 가능하다는 뜻입니다. ‘교통 빅데이터’는 단순히 밀리는 길을 피하는 요령이 아닙니다. 교통 환경 개선을 통해서 국가자원의 불필요한 소모를 막을 것이고, 또 정책수립에도 중대한 영향을 미칠 것입니다. 민간에서도 다른 산업으로 연계될 수 있는 아주 소중한 가치를 가지고 있습니다.

∘기업들의 관심도 대단할 것 같은데요.

→ 세계제일의 기업이지요. 구글이 지난 2013년, 이스라엘의 벤처기업인, 네비게이션 어플리케이션 업체 웨이즈(waze)를 약 11억달러, 원화로 1조 2천억이 넘는 돈을 주고 샀습니다. 구글 역사상 네 번째로 큰 규모입니다. 구글은 이미 유사한 네비게이션 서비스를 제공하고 있었지만, 웨이즈가 가지고 있는 특성, 그러니까 ‘사용자들이 참여’하는 ‘실시간 교통정보’, 바로 빅데이터입니다. 이것의 가치를 높게 평가하고 엄청난 금액을 지불한 것이지요.

→ 국내에서도 마찬가지입니다. 국민메신저 카카오톡도 지난 2015년 빅데이터 기반의 네비게이션 김기사를 626억원에 인수해서 자회사로 편입한바 있습니다. 카카오 네비게이션은 업계2위 수준으로 평가받고 있습니다. 그리고 무려 14년 동안의 축적된 빅데이터를 자랑하는 SK플래닛의 T맵이 선두를 지키고 있는 것으로 보입니다. 네이버 역시 네이버지도에 네비게이션 기능을 추가해서 바싹 뒤를 추격하고 있습니다. 지난 7월 KT와 LGU+는 ‘원내비’로 함께 네비게이션 개발에 나섰습니다. 정말 치열한 경쟁이 아닐 수 없습니다. 그만큼 교통관련 빅데이터가 가치 있다는 반증이 아닐까 합니다.

∘교통관련 빅데이터라고 하면 교통정보 방송만 생각했는데 정말 엄청나네요.

→ ‘교통 정보’라고하면 많은 분들이 당연히 교통방송만 생각합니다. 하지만 생각보다 많은 곳에 교통 빅데이터가 활용되고 있습니다. 역시 빅데이터의 특성중 하나인데요. 빅데이터는 너무 큰 데이터를 다루기 때문에 ‘정확하기도 어렵고’, ‘수치적으로 값을 산출하여 제공하는 것’도 큰 의미가 없습니다. 빅데이터의 활용은 일종의 패턴 정보를 제공하는 것인데요. 그래서 나타나는 서비스 제공방식이 ‘시각화’와 ‘맞춤화’입니다.

∘새로운 용어인 것 같습니다. ‘시각화’와 ‘맞춤화’가 무슨 의미일까요?

→ 먼저 ‘시각화’부터 말씀드리겠습니다. 아무리 좋은 정보라도 인간이 이해하기 어렵고, 실생활에 적용하지 못한다면 가치가 없습니다. 그래서 대부분의 빅데이터 값들은 ‘시각화’, 그러니까 도표나, 색상, 그림을 활용한 인포그래픽(Infographics)의 형태로 제공됩니다. 예를 들면 많이 밀리는 길은 붉은색, 조금 덜 밀리는 도로는 주황색으로 표현하는 것들이 되겠지요.

∘아! 이해를 돕기 위해 시각적으로 정보를 표현한다는 뜻이군요.

→ 그렇습니다. ‘맞춤화’는 더 재미있습니다. 고객에 대한 많은 데이터, 그러니까 빅데이터를 가지게 되면 개개인의 다양한 요구를 서비스 제공자가 이해하기에 훨씬 쉬워집니다. 그런데 이런 다양한 분석결과를 개인에게 해석하고, 선택하게 한다면, 이해의 시간도 없고 활용할 시기도 놓쳐서, 활용의 의미를 잃기 마련입니다. 때문에 빅데이터는 이용자가 빅데이터를 이용한다는 것도 인식할 수 없을 만큼 빠르게, 개개인에게 가장 적절한 서비스를 제공하는 것이 일반적입니다. 앞서 말씀드린 구글의 네비게이션 웨이즈는 사용자의 페이스북이나 인터넷 기록 등 빅데이터를 분석해서 이동 중에 가장 적절한 광고정보를 제공합니다. 예를 들어 네비게이션의 목적지가 스포츠경기장이라면, 근처 패스트푸드점을 지날 때, 경기장에서 먹기 편한 메뉴 광고나 할인쿠폰을 알려주기도 합니다. 아무런 설정이나, 입력 없이 자연스럽게 제공되는, ‘맞춤형’ 서비스입니다.

∘정말 빅데이터가 우리도 모르는 사이 많이 활용되고 있네요.

→ 그렇습니다. 수년 전이지요. 당시 저는 ‘김기사’라는 네비게이션을 사용했었는데요. 멀리 경북 영덕에 출장을 갔던 적이 있었습니다. 맛 집 검색을 해보면, 잘 모르는 지역이기도 하고, 워낙 많은 광고 글 들이 있어서 혼란스럽기만 했습니다. 그래서 당시 네비게이션 화면에 제공되던 ‘다른 사람이 많이 검색한 지점’을 참고로 식당을 선택했는데요. 정말 틀린 적이 없었습니다. 지금도 일부 현명한 네티즌들은 페이스북이나 인스타그램의 위치정보, 해쉬태그(#)정보를 활용해서 많은 사람이 방문한 장소를 재방문하고 있는 것으로 알고 있습니다. 하나의 정보 소스에서 얻어진 아주 적은 양의 데이터라 빅데이터라고 말하기는 어렵지만, 개념적으로는 빅데이터의 활용이라고 말할 수 있을 것입니다.

∘‘빅데이터’라는 것이 정말 재미있고 유용한 것 같습니다. 마지막으로 덧붙여 하시고 싶은 말씀 있으신지요?

→ 빅데이터의 활용에 있어 가장 흔한 것은 ‘미래에 대한 예측’입니다. 미래를 안다는 것이 큰 효용을 주기 때문이겠지요. 교통 빅데이터는 ‘미래에 벌어질 일’들을 미리 알게 해서, 사고를 방지하거나 정책을 수립하는 것처럼 많은 부분에 큰 영향을 미칠 것입니다. 그리고 우리는 더 빨리, 편안하게 목적지로 이동할 수 있을 것입니다. 이번 방송을 통해, 애청자들께서, 빅데이터 기반의 교통정보를 이해하는데, 조금이나마 도움이 되었으면 하는 바람입니다. 그리고 빠른 것도 좋지만, 안전이 가장 중요하다는 점 잊지 않으셨으면 합니다.

∘좋은 말씀 감사합니다. 수고하셨습니다. 시청자 여러분도 모두 안전운전 하셨으면 합니다.

→ 감사합니다.

[저작권자(c) YTN radio 무단전재, 재배포 및 AI 데이터 활용 금지]
목록
  • 이시간 편성정보
  • 편성표보기
말벗서비스

YTN

앱소개