환영해🦉
기술/연구

“이제 성우 필요 없다?” 구글, 감정 섞인 목소리 AI 공개

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.02.04 23:22
“이제 성우 필요 없다?” 구글, 감정 섞인 목소리 AI 공개

기사 3줄 요약

  • 1 구글, 감정 담은 제미나이 음성 AI 공개
  • 2 속도와 톤 자유자재 조절로 인간 넘보나
  • 3 콘텐츠 제작 비용 줄고 몰입도 대폭 상승
혹시 방금 들은 팟캐스트 진행자가 사람이 아닐 수도 있다는 생각 해보셨나요. 그동안 기계음 티가 났던 AI 목소리가 이제는 소름 돋을 정도로 사람과 똑같아졌습니다. 구글이 사람의 미묘한 감정선까지 완벽하게 연기하는 새로운 AI 모델을 내놨기 때문입니다. 이제 목소리만 듣고는 사람인지 기계인지 구별하기 힘든 세상이 왔습니다.

감정 연기까지 마스터했어

구글은 최근 ‘제미나이 2.5 TTS’라는 새로운 음성 기술을 세상에 공개했습니다. 이번 모델의 핵심은 단순히 글자를 읽는 수준을 넘어섰다는 점입니다. 사용자가 ‘밝고 신나는 톤으로 읽어줘’라거나 ‘진지하고 침착하게 말해줘’라고 주문하면 AI가 찰떡같이 알아듣고 연기합니다. 롤플레잉 게임 캐릭터나 가상 비서의 목소리가 훨씬 생동감 넘치게 바뀌는 겁니다. 심지어 문장의 맥락을 파악해서 말하는 속도까지 스스로 조절하는 기능도 생겼습니다. 농담을 할 때는 타이밍을 맞춰서 살짝 뜸을 들이기도 하고, 긴박한 액션 장면 묘사는 빠르게 말합니다.

진짜 사람처럼 자연스러워

여러 명이 대화하는 상황도 이제는 문제없습니다. 팟캐스트나 인터뷰 형식의 콘텐츠를 만들 때 AI가 여러 사람의 목소리를 동시에 연기합니다. 각 캐릭터마다 고유한 말투와 톤을 유지하면서 자연스럽게 대화를 주고받습니다. 심지어 24개국 언어를 지원해서 외국어 더빙도 아주 쉽게 해결할 수 있게 되었습니다. 구글 발표에 따르면 개발자가 ‘느리게’ 혹은 ‘더 빠르게’라고 구체적으로 지시하면 예전보다 훨씬 정확하게 반응한다고 합니다. 이제 감독이 배우에게 연기 지도를 하듯이 AI에게 디테일한 주문을 할 수 있게 된 겁니다.

비용은 줄고 효율은 폭발해

실제로 이 기술을 써본 기업들의 반응은 폭발적입니다. 오디오 제작 플랫폼인 원더크래프트는 제미나이 기술을 도입하고 나서 놀라운 성과를 거뒀습니다. 회사 발표에 따르면 구독자는 20%나 늘어났는데 비용은 오히려 20%나 줄었다고 합니다. 사람을 고용해서 녹음하고 편집하는 과정이 획기적으로 줄어들었기 때문입니다. 웹툰 기업 툰수트라 역시 캐릭터의 성격에 딱 맞는 목소리를 일관성 있게 만들어낼 수 있다며 극찬했습니다. 이제 방구석 크리에이터도 헐리우드급 성우를 고용한 것 같은 효과를 낼 수 있습니다.

앞으로 우리 귀는 어떻게 될까

이번 기술 혁신은 콘텐츠 제작의 진입 장벽을 완전히 무너뜨리고 있습니다. 누구나 아이디어만 있으면 고퀄리티 오디오 콘텐츠를 만들 수 있는 시대가 열렸습니다. 하지만 한편으로는 전문 성우나 내레이터들의 일자리가 위협받을 수 있다는 우려도 나옵니다. 기술의 발전이 우리에게 편리함을 주지만 동시에 새로운 고민거리를 던져주고 있습니다. 앞으로 우리가 듣는 오디오북, 광고, 유튜브 내레이션의 대부분이 AI의 목소리로 채워질지도 모릅니다. 그때 우리는 인간의 목소리에 더 큰 가치를 느끼게 될지, 아니면 AI의 편리함에 완전히 적응하게 될지 지켜봐야겠습니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 음성이 성우를 완전히 대체할 수 있을까?

댓글 0