“성우들 설 자리 잃나” 감정까지 연기하는 구글 AI 등장
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.02.06 11:01
기사 3줄 요약
- 1 구글이 감정 연기 가능한 제미나이 2.5 TTS 공개
- 2 상황에 맞춰 말하기 속도 조절하고 다중 화자 연기도 척척
- 3 오디오북과 마케팅 등 콘텐츠 제작 비용 대폭 절감 기대
라디오에서 흘러나오는 감미로운 목소리가 사람이 아니었다면 믿어지시나요.
구글이 최근 발표한 새로운 인공지능 기술이 목소리 연기 시장에 거대한 충격을 주고 있습니다. 단순히 글자를 읽어주는 수준을 넘어 감정과 호흡까지 완벽하게 연기하는 기술이 등장했기 때문입니다. 이제는 기계음과 사람의 목소리를 구분하는 것조차 어려워질 전망입니다.
구글은 지난 10일 기존 모델을 완전히 대체하는 ‘제미나이 2.5 TTS’ 모델을 전격 공개했습니다. 이 기술은 개발자가 목소리의 스타일과 톤, 속도, 억양을 마치 영화감독처럼 정교하게 조종할 수 있게 해줍니다. 실제 성우가 녹음실에서 연기하듯 AI가 대본을 소화하는 시대가 열린 것입니다.
기계음은 옛말, 이제 연기까지 한다고
이번 기술의 핵심은 AI가 사람의 감정을 이해하고 표현한다는 점입니다. 사용자가 ‘밝고 명랑하게’ 혹은 ‘진지하고 침착하게’라고 주문하면 AI는 그 분위기에 딱 맞는 목소리를 만들어냅니다. 심지어 게임 캐릭터의 연기나 비서의 안내 멘트처럼 특정한 역할에 맞는 목소리 톤까지 자유자재로 구사합니다. 구글에 따르면 이번 업데이트는 단순한 정보 전달을 넘어 롤플레잉 게임이나 오디오북처럼 고도의 연기력이 필요한 분야에서도 즉시 활용할 수 있습니다. 로봇이 책을 읽어주는 딱딱한 느낌이 아니라 성우가 옆에서 이야기를 들려주는 듯한 생생함을 느낄 수 있습니다. 개발자들은 데모 앱을 통해 이런 놀라운 변화를 직접 체험할 수 있습니다.눈치 백단 AI, 분위기 파악하고 속도 조절
새로운 제미나이 모델은 문장의 맥락을 파악해 말하는 속도까지 스스로 조절하는 ‘눈치’를 갖췄습니다. 농담을 던질 때는 타이밍을 맞춰 능청스럽게 말하고 복잡한 설명이 나올 때는 청중이 이해하기 쉽게 천천히 또박또박 읽습니다. 긴박한 액션 장면 묘사에서는 속도를 높여 긴장감을 고조시키기도 합니다. 개발자가 구체적으로 “느리게 읽어줘”라거나 “중간 속도로 해줘”라고 지시하면 이를 찰떡같이 알아듣고 반영합니다. 과거에는 일일이 속도를 설정해야 했던 번거로움이 사라지고 AI가 알아서 자연스러운 리듬을 만들어내는 것입니다. 이는 팟캐스트나 뉴스 브리핑 제작자들에게 엄청난 시간 단축 효과를 가져다줍니다.성우 여러 명 필요 없다, 혼자 북 치고 장구 치고
이번 기술의 또 다른 강력한 무기는 한 번에 여러 명의 목소리를 낼 수 있다는 점입니다. 인터뷰 형식의 콘텐츠나 등장인물이 많은 소설을 만들 때 AI 혼자서 다양한 캐릭터의 목소리를 서로 다르게 연기합니다. 화자가 바뀔 때마다 목소리 톤과 억양이 자연스럽게 전환되어 청취자가 어색함을 느끼지 않게 합니다. 실제로 인공지능 오디오 플랫폼 원더크래프트에 따르면 제미나이 TTS 도입 이후 비용을 20%나 절감했다고 합니다. 인도 콘텐츠 기업 툰수트라 역시 웹툰 캐릭터 음성 연출에 이 기술을 활용해 높은 품질을 유지하고 있습니다. 앞으로 이 기술은 오디오북과 교육 콘텐츠, 마케팅 영상 등 다양한 분야에서 인간의 목소리를 빠르게 대체해 나갈 것으로 보입니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 음성, 성우 일자리 대체 찬성?
찬성
0%
0명이 투표했어요
반대
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사