환영해🦉
기술/연구

“성우들 진짜 울겠다” 구글 제미나이 사람 목소리 완벽 복제

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.02.27 15:33
“성우들 진짜 울겠다” 구글 제미나이 사람 목소리 완벽 복제

기사 3줄 요약

  • 1 구글 제미나이 2.5 공개, AI가 감정 연기까지 수행
  • 2 문맥 따라 속도 조절하고 여러 명 목소리 완벽 구현
  • 3 성우 위협하는 기술 등장, 콘텐츠 제작 비용 대폭 절감
구글이 인공지능 음성 합성 기술의 판도를 뒤집을 새로운 모델을 공개했습니다. 구글에 따르면 이번에 발표된 ‘제미나이 2.5 TTS’는 기존 모델을 완전히 대체하는 혁신적인 업그레이드입니다. 이 기술은 단순히 텍스트를 읽는 수준을 넘어섰습니다. 개발자들은 이제 AI의 목소리 톤과 속도, 억양까지 아주 정교하게 제어할 수 있게 되었습니다. 가장 놀라운 점은 AI가 상황에 맞춰 ‘메소드 연기’를 한다는 것입니다. 구글 발표에 따르면 사용자가 ‘밝고 낙관적인 톤’이나 ‘침착하고 진지한 톤’을 요청하면 AI가 이를 완벽하게 재현합니다. 마치 실제 성우가 연기하는 것처럼 감정선을 살려냅니다. 롤플레잉 게임 캐릭터나 가상 비서의 목소리가 훨씬 더 자연스러워질 전망입니다.

기계음은 옛말, 알아서 속도 조절하는 똑똑한 AI

이번 모델은 문맥을 이해하고 말하는 속도를 스스로 조절하는 ‘지능형 페이싱’ 기능을 갖췄습니다. 농담을 할 때는 타이밍을 살리고, 복잡한 설명을 할 때는 천천히 말합니다. 액션 장면처럼 긴박한 상황에서는 빠르게 말하며 리듬감을 만듭니다. 듣는 사람 입장에서는 기계가 아닌 사람이 말하는 것처럼 느껴질 수밖에 없습니다. 여러 명이 대화하는 상황도 문제없습니다. 팟캐스트나 인터뷰 콘텐츠를 만들 때 AI가 서로 다른 캐릭터의 목소리를 유지하며 자연스럽게 대화를 주고받습니다. 이전에는 어색했던 화자 전환이 매끄러워졌습니다. 혼자서도 라디오 드라마 같은 고퀄리티 오디오 콘텐츠를 뚝딱 만들 수 있게 된 셈입니다.

콘텐츠 제작 비용 대폭 절감, 성우들은 긴장

실제 기업들의 성과도 이를 증명합니다. 인공지능 오디오 플랫폼 원더크래프트에 따르면 제미나이 TTS 도입 후 제작 비용이 20%나 절감되었습니다. 비용은 줄었는데 구독률은 오히려 20% 증가했습니다. 툰수트라 같은 콘텐츠 기업도 웹툰 캐릭터 음성 연출에 이 기술을 적극 활용하고 있습니다. 이제 누구나 구글 AI 스튜디오를 통해 이 기술을 즉시 사용할 수 있습니다. 전문적인 장비나 성우 섭외 없이도 수준 높은 음성 콘텐츠 제작이 가능해졌습니다. 기술의 발전이 콘텐츠 시장에 어떤 변화를 가져올지 기대가 모아집니다. 동시에 인간 성우들의 입지가 어떻게 변할지도 지켜봐야 할 대목입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 음성 합성, 성우 직업 대체해도 괜찮다?

댓글 0