구글 "'실시간 자막'에 통역·저장기능 확장"
한국어 오류율 20% 미만…"데이터 쌓아 정확도 개선"
2019-03-14 14:31:34 2019-03-14 14:31:34
[뉴스토마토 김동현 기자] 구글이 '실시간 자막(라이브 트랜스크라이브)'에 실시간 번역·저장 기능 등을 추가해 서비스 편의성을 넓힌다. 한국어 서비스의 오류율은 20% 미만으로 한국어 데이터를 추가 확보해 정확도도 개선할 계획이다.
 
사가 사블라 구글 AI 리서치 프로덕트 매니저가 14일 서울시 강남구 구글코리아와 미국 구글 본사를 실시간 연결해 진행한 '구글 AI포럼:접근성 개선을 위한 AI, 라이브 트랜스크라이브'에서 '실시간 자막' 앱 구현 원리를 설명하고 있다. 사진/김동현 기자
 
사가 사블라 구글 AI(인공지능) 리서치 프로덕트 매니저는 14일 서울시 강남구 구글코리아와 미국 구글 본사를 실시간 연결해 진행한 '구글 AI포럼:접근성 개선을 위한 AI, 라이브 트랜스크라이브'에서 "이용자에게 최상의 경험을 제공하기 위해 통역·저장 기능 등을 연구 중"이라고 말했다. 실시간 자막은 청각 장애·감퇴를 겪는 이용자의 일상생활 접근성을 높이기 위한 무료 서비스로 지난달 출시됐다.
 
실시간 자막은 구글 음성 AI 기술을 집약한 서비스로, 기계학습(머신러닝·ML) 음성 텍스트 변환 기술을 활용해 대화를 실시간으로 자막화해 보여준다. 지원 언어는 70여개에 이른다. 다만 아직까진 다자간 대화를 한다거나 네트워크 환경이 달라질 경우 제약이 따르는 등 범용성이 다소 떨어지던 상황이다. 구글은 단순 대화 자막 기능을 넘어 서비스 확장에 나서며 이같은 상황을 극복한다는 계획이다. 가령 기존에는 한국어로 말하면 한글 자막이 나오는 데 그쳤지만 서비스가 확장될 경우 외국어 자막 지원도 가능해져 국적을 넘어 직접 대화하는 것도 가능해질 전망이다. 
 
사블라 매니저는 "실시간 자막을 개발한 목표는 ML 연구를 특정 영역을 강화한 앱으로 이용하도록 하기 위함"이라며 "구글 슬라이드 등 구글 서비스에도 자막 지원을 하고 있다"고 말했다. 구글은 통역·저장 기능뿐 아니라 △인터넷 연결 없이 앱 사용 △시청각을 활용한 화자 구분 △음성 인식 향상 등 연구를 진행 중이다.
 
한국어 서비스 오류율은 20% 미만이다. 가장 오류율이 떨어질 것으로 예상되는 영어의 경우 지난 2017년 기준 4.9%였다. 영어 서비스와 비교했을 때 한국어 서비스의 정확도가 떨어지지만 사블라 매니저는 고무적 수치로 평가했다. 그는 "한국어 오류율이 20% 미만으로 나오는데 이는 굉장히 좋은 수치"라며 "한국어 데이터를 수집하고 쌓으며 정확도를 높일 것"이라고 말했다.
 
구글 실시간 자막은 기기(디바이스)와 클라우드 등 2개 신경망을 활용한다. 디바이스 신경망은 대화 존재 여부와 대화 외 기타 소음 등을 구분한다. 클라우드 신경망은 음성인식 엔진을 탑재해 대화를 인식, △음소 구분 △각 단어의 사전적 의미 연결 △맥락 파악 등의 역할을 맡는다. 다만 이 엔진을 디바이스에 탑재하면 디바이스 성능 저하를 유발한다. 현재 구글 실시간 자막을 이용하려면 네트워크 환경이 뒤따라줘야 하는 이유가 여기에 있다. 사블라 매니저는 "음성인식 엔진을 디바이스로 옮기는 연구도 진행 중"이라며 "이용자 확장을 위해 인터넷 연결이 필요 없도록 할 계획"이라고 말했다.
 
14일 서울시 강남구 구글코리아와 미국 구글 본사를 실시간 연결해 진행한 '구글 AI포럼:접근성 개선을 위한 AI, 라이브 트랜스크라이브'. '실시간 자막' 앱 서비스 이용 장면이 화면에 나오고 있다. 사진/구글
 
김동현 기자 esc@etomato.com
 
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김기성 편집국장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

지난 뉴스레터 보기 구독하기
관련기사