생생플러스
  • 방송시간 : [월~금] 15:00~16:00
  • 진행 : 김우성 / PD: 김우성 / 작가: 이혜민

인터뷰 전문

[생생인터뷰] AI(인공지능)가 스피커에 귀 기울이는 이유
작성자 : ytnradio
날짜 : 2017-04-17 16:26  | 조회 : 3461 
[생생인터뷰] AI(인공지능)가 스피커에 귀 기울이는 이유


■ 방송 : YTN 라디오 FM 94.5 (15:10~16:00)
■ 진행 : 김우성 PD
■ 대담 : 박현제 정보통신기술진흥센터 총괄CP


◇ 김우성 PD(이하 김우성)> 인공지능, AI 분야에 대한 부분입니다. 지금까지와 완전히 다르다, 전문가들이 통상 하는 말인데요. 더 좋아지는 것이 아니라 완전 다른 무언가가 시작된다고 볼 수 있을 겁니다. 그런데 인공지능 오디오 서비스가 각광받고 있습니다. 이른바 AI 스피커입니다. 아날로그한 느낌이죠. 대화로 창문 좀 열어줘, 불 좀 꺼줄래? 이렇게 얘기하면 실제로 들어주는 겁니다. 단지 이러한 서비스뿐만 아니라 왜 여기에 많은 기업들, 특히 통신사와 같은 곳들이 힘을 쓰고 있는지 그 배경을 알아보겠습니다. 박현제 정보통신기술진흥센터 총괄CP 전화로 연결합니다. 안녕하십니까?

◆ 박현제 정보통신기술진흥센터 총괄CP(이하 박현제) 네, 안녕하세요.

◇ 김우성> 일단 AI, 소개는 많이 됐습니다. 인공지능으로 알려졌는데요. 이게 사실 80년대 후반에도 인공지능이라는 말이 유행했거든요. 아직도 AI가 정확히 모르는 분이 있는데요. 설명 좀 부탁드립니다. 

◆ 박현제> AI는 컴퓨터가 지능을 갖는다, 혹은 기계가 지능을 갖는다는 의미죠. 과거에는 보통 대표적으로 인공지능이라고 하면 로봇청소기와 같은 것을 예로 들 수 있는데요. 로봇청소기가 대게 미리 지정되어 있는 몇 가지 규정에 의해 스스로 추론하고 판단해서 행동을 할 수 있는 기능이 있다는 뜻에서 인공지능을 사용합니다. 

◇ 김우성> 스스로 판단하고 결정한다, 다른 부분이긴 합니다. 그런데 이게 이른바 아직 플랫폼이나 생활에 어떻게 적용되는지는 낯선 편이 있는데요. 통신사들이 스피커 서 있으면 대화를 하는, 이런 서비스를 출시하고 있거든요. 그 배경은 무엇인가요?

◆ 박현제> 과거 통신사들이 했던 것이 보통 통신 서비스나 조금 나아가 인터넷 서비스를 하고 있는데요. 이러한 서비스는 과거에는 다른 여러 가지 기능이나 기술이 공통적으로 활용될 수 있는 플랫폼 형태로 작용됐어요. 그런데 이제 문제는 플랫폼이 계속 고도화되어 통신망이나 인터넷보다는 대화 서비스나 검색이나 포털, 이런 기능들, 플랫폼이라고 하고 있고요. 이런 서비스들이 과거 통신 서비스보다 훨씬 부가가치가 높아지는 거죠. 

◇ 김우성> 앞서 여러 가지 통신사들, 여러 가지 AI 기술이 오디오 콘텐츠에 집중한다는 것들을 계속 소개해드렸는데요. TV 광고를 통해서 청취자분들도 많이 보셨을 텐데, 지금 스마트폰에도 있고 댁에서 인터넷과 연결된 오디오 서비스를 쓰기도 하는데요. 왜 하필 오디오에, 홈 스피커에 집중해서 개발하고 이 부분에 관심을 두는지 궁금합니다. 

◆ 박현제> 우리가 과거에 컴퓨터나 우리가 갖고 있는 기기들을 다루는 방식을 보통 그래픽 유저 인터페이스라고 합니다. 스마트폰에서 보면 화면을 열어서 필요한 메뉴를 선택하는 과정이 눈으로 확인하는 거죠. 우리가 요즘에는 사물 인터넷이라고 해서 많은 기기들이 들어오는데요. 이를 눈으로 보고 하기에는 너무 불편해진 거죠. 예를 들어서 불을 끄려면 스마트폰을 꺼내어 열어서 몇 가지 선택을 한 다음에야 불을 끌 수 있는데, 이 인공지능은 스피커로부터, 그것도 5~6m 멀리에서도 다른 것 하면서 부르면 되는 거죠. 나리야, 불 꺼줘. 이렇게 하면 불을 꺼주는, 아주 단순하고 편리해져서 이러한 이유 때문에 인공지능 비서들이 점점 각광받고 있는 상태입니다. 

◇ 김우성> 훨씬 더 사람에게 편해졌다는 느낌인데요. 말씀하신 특정 통신사 서비스에 YTN RADIO를 들려줘, 이렇게 말하면 실제로 들려주기도 하거든요. 굉장히 그러한 면은 특이한데 아직 더 복합한 주문이나, 이를테면 내가 좋아하는 피자를 시켜줘, 이런 것들은 가능한가요?

◆ 박현제> 그건 아직 안 됩니다. 현재 서비스들이 아직 사람을 구별을 못 합니다. 그래서 내가 이야기하나 아내가 이야기하나 똑같은 사람으로 인식하지, 이전에 어떤 것을 했던 사람이라고 기억을 못 해줍니다. 그래서 그 사람이 그동안 해온 대화 내용을 쭉 기록한다거나 아니면 그 사람이 좋아 하는 것을 안다거나, 또 하나는 대화 기능, 무엇을 시키려면 한 번 불러야 합니다. 나리야, 알렉스, 하고 한마디 하고, 또 나리야, 부르고 또 한마디를 해야 하는데요. 대화를 쭉 이어갈 수 있는 기능이라든지, 이런 것들은 아직 전혀 안 되는 거죠. 또 하나는 검색 서비스, 우리가 컴퓨터에서 검색을 하면 다 찾아 주는데요. 아직 이러한 서비스들은 제한된 형태 검색만 제공해줄 수 있는 형태입니다. 

◇ 김우성> 문뜩 요리 같은 것을 하다가 면을 삶는 시간, 이런 것들을 하면 좋겠다 싶었는데 아직 그 정도 기술은 안 됐고요. 라디오 방송을 청취자분들에게 보내드리고 있는데요, 오디오 콘텐츠 서비스 생태계가 인공지능과 함께 많이 변화할 것이라는 말이 나오고 있더라고요. 앞으로의 전망은 어떤가요?

◆ 박현제> 우리는 아까 말씀드린 그래픽 유저 인터페이스, GUI가 생기면서 굉장히 많은 디자이너가 생겼는데요. 어떻게 하면 좀 더 지각적으로 표현을 잘 할 수 있는지, 전달할 수 있는지, 이런 것들을 하듯이 이제는 사람과 컴퓨터 인터페이스가 음성으로 변하기에 어떻게 하면 좀 더 사람의 감정을 정확하게 전달할 수 있는지, 말소리를 듣고 이 사람이 무슨 생각을 하고 있는지, 이런 것을 구별할 필요가 있는 거죠. 그래서 알렉스 등을 보면 항상 같은 목소리입니다. 목소리를 바꾸기도 어려워요. 내가 원하는 목소리가 있는데 내가 원하는 목소리에 맞춰서 좀 더 감성적으로 바꾼다거나, 음성과 여러 이미지, 영상을 결합해준다든지, 이러한 여러 가지 형태의 새로운 목소리, 음성과 감정을 할 수 있는 여러 가지 형태가 생기면 전혀 다른 형태의 음성과 오디오 생태계가 생길 수 있을 것 같다고 생각합니다. 

◇ 김우성> 감성, 편리성과 개개인의 개성까지 살린다면 지금까지 디지털 콘텐츠와는 완전히 다르다는 생각을 하실 것 같습니다. 오늘 말씀 감사드립니다.

◆ 박현제> 감사합니다. 

◇ 김우성> 지금까지 박현제 정보통신기술진흥센터 총괄CP였습니다.

[저작권자(c) YTN radio 무단전재, 재배포 및 AI 데이터 활용 금지]
  목록
  • 이시간 편성정보
  • 편성표보기
말벗서비스

YTN

앱소개