환영해🦉
기술/연구

“성우들 밥줄 끊기나..” 구글 제미나이 목소리 소름

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.02.13 06:03
“성우들 밥줄 끊기나..” 구글 제미나이 목소리 소름

기사 3줄 요약

  • 1 구글 제미나이 2.5 TTS 모델 공개
  • 2 감정 표현과 말하기 속도 자유 조절
  • 3 성우 위협하는 압도적 목소리 성능
사람과 구분이 불가능한 인공지능 목소리가 등장해 전 세계가 충격에 빠졌습니다. 구글이 자사의 음성 합성 기술을 획기적으로 업그레이드한 ‘제미나이 2.5 TTS’를 공개했습니다. 이번 모델은 단순히 글자를 읽어주는 수준을 넘어섰습니다. 진짜 사람처럼 감정을 싣고 호흡까지 조절하는 능력을 갖췄습니다. 전문 성우나 아나운서의 영역까지 위협할 정도의 고품질입니다. 콘텐츠 제작자들은 환호하고 있지만 성우 업계에는 비상이 걸렸습니다. 기술의 발전이 인간의 고유 영역인 ‘목소리 연기’까지 넘보고 있습니다.

감정까지 연기하는 AI 등장

이번 발표의 핵심은 인공지능이 ‘연기’를 시작했다는 점입니다. 구글에 따르면 새로운 제미나이 모델은 사용자의 지시에 따라 목소리 톤을 자유자재로 바꿉니다. ‘밝고 희망찬 목소리’를 주문하면 하이톤의 경쾌한 목소리를 냅니다. 반대로 ‘침착하고 진지한 톤’을 요구하면 무게감 있는 목소리로 변합니다. 심지어 비꼬는 말투나 속삭이는 소리까지 구현합니다. 이는 게임 캐릭터나 오디오북 제작에 엄청난 변화를 가져옵니다. 기존 기계음은 감정이 없어 어색했습니다. 하지만 제미나이 2.5는 상황에 맞는 완벽한 연기를 보여줍니다. 개발자들은 별도의 복잡한 코딩 없이 명령어만으로 성우급 연기를 만들어낼 수 있게 되었습니다.

상황에 맞춰 말하기 속도 조절

AI가 문맥을 이해하고 말하는 속도를 스스로 조절하는 기능도 추가되었습니다. 구글 발표에 따르면 이번 모델은 ‘지능형 페이싱’ 기술을 탑재했습니다. 농담을 할 때는 타이밍을 맞춰 능청스럽게 말합니다. 복잡한 정보를 설명할 때는 천천히 또박또박 발음합니다. 반면 긴박한 액션 장면 묘사에서는 속사포처럼 빠르게 말합니다. 사람이 대화할 때 숨을 고르거나 템포를 조절하는 것과 똑같습니다. 개발자가 구체적으로 “이 부분은 느리게 읽어줘”라고 지시하면 즉각 반영합니다. 덕분에 청취자는 AI가 아닌 실제 사람이 말하는 것 같은 자연스러움을 느낍니다. 팟캐스트나 뉴스 브리핑 분야에서 활용도가 폭발적으로 늘어날 전망입니다.

여러 명 목소리도 완벽 소화

혼자서 여러 명의 목소리를 동시에 연기하는 ‘다중 화자’ 기능도 강력해졌습니다. 구글 자료에 따르면 제미나이 TTS는 하나의 모델로 서로 다른 캐릭터의 목소리를 일관되게 유지합니다. 인터뷰 상황이나 여러 등장인물이 나오는 드라마 대본도 문제없습니다. 남녀노소 다양한 목소리를 끊김 없이 자연스럽게 전환하며 들려줍니다. 실제 성과도 놀랍습니다. 오디오 제작 플랫폼 ‘원더크래프트’에 따르면 해당 기술 도입 후 구독률이 20%나 증가했습니다. 비용은 오히려 20% 절감되었습니다. 인도 기업 ‘툰수트라’ 역시 웹툰 캐릭터 음성 연출에 이 기술을 적용해 호평을 받았습니다. 이제 방 안에서 AI만으로 고품질의 라디오 드라마를 제작하는 시대가 열렸습니다. 누구나 감독이 되어 자신만의 오디오 콘텐츠를 만들 수 있게 된 것입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 음성, 성우 일자리 대체 찬성?

댓글 0