[뉴스토마토 홍연 기자]
KT(030200)가 인간의 감정을 담아 인공지능(AI) 음성합성 콘텐츠를 제작할 수 있는 ‘AI 보이스 스튜디오’ 서비스를 출시했다고 19일 밝혔다.
AI 보이스 스튜디오는 100개의 AI 목소리를 활용해 즐거움·침착함·중립·슬픔·화남의 5가지 감정으로 합성할 수 있는 ‘AI 보이스’와, 이 AI 보이스를 활용해 영상 등 오디오 합성 콘텐츠를 제작할 수 있는 ‘스튜디오’로 구성돼 있다.
KT AI 보이스 스튜디오는 국내 최초로 적용된 ‘감정 더빙’ 기술이 탑재돼 있다. 이 기능을 활용하면 AI 보이스를 내가 낭독한 감정 그대로 더빙할 수 있어 더 생생한 AI 음성을 만들 수 있다. KT AI 보이스 스튜디오가 제공하는 모든 AI 목소리는 한국어, 영어, 중국어, 일본어 4개 국어로 ‘다국어 합성’이 가능하다.
KT는 매력적인 AI 보이스를 제공하기 위해 유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’를 준비했다. 첫 번째 ‘셀럽 AI 보이스’는 가수 윤도현으로 오디오북을 제작할 수 있도록 낭독체와 대화체가 담겨있다. 행복, 슬픔, 분노 등의 감정 표현도 제공한다. 다만 ‘셀럽 AI 보이스’는 셀럽의 권리 보호를 위해 홈페이지의 문의하기 기능을 활용해 별도 정책에 따라 이용할 수 있다.
KT는 이러한 AI 보이스 스튜디오의 우수함을 체험할 수 있도록 독서 플랫폼 ‘밀리의서재’와 협업했다. AI 윤도현의 목소리로 인기 도서 ‘인간관계가 힘들어서 퇴사했습니다’를 오디오북으로 제작했다. AI 윤도현이 낭독하는 ‘인간관계가 힘들어 퇴사했습니다’는 밀리의서재에서 들어볼 수 있다.
KT AI 보이스 스튜디오의 웹 버전은 월별 AI 보이스 제공량에 따라 △프리(무료, 4000자) △베이직(1만2,000원, 2만4000자) △프로(4만8000원, 12만자) △프로맥스(12만원, 38만4000자) 4종의 요금제가 준비돼 있다. AI 보이스 스튜디오의 API 버전은 kt cloud를 통해 월 기본료 10만원에 제공된다.
최준기 KT AI·BigData사업본부 본부장은 “이번에 출시한 AI 보이스 스튜디오는 KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상했다”며 “향후 KT는 그룹사를 비롯한 다양한 파트너와 협력해 더 혁신적인 AI 보이스 스튜디오 서비스를 지속 출시하겠다”고 말했다.
KT AI 보이스 스튜디오 관련 이미지. (사진=KT)
홍연 기자 hongyeon1224@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 강영관 산업2부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지