환영해🦉
기술/연구

“성우들 다 망했다?” 구글 AI 목소리, 소름 돋는 감정 연기

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.02.09 00:28
“성우들 다 망했다?” 구글 AI 목소리, 소름 돋는 감정 연기

기사 3줄 요약

  • 1 구글 제미나이 2.5 TTS 공개, 감정 연기 대박
  • 2 속도 조절부터 다중 화자 대화까지 완벽 소화
  • 3 성우 대체 현실화? 콘텐츠 제작 시장 판도 변화
혹시 AI가 읽어주는 책이나 영상을 보면서 어색하다고 느낀 적 있나요. 로봇처럼 딱딱한 말투 때문에 몰입이 안 될 때가 많았습니다. 그런데 이제 그런 시대는 끝난 것 같습니다. 구글이 사람보다 더 사람 같은 목소리를 내는 새로운 AI 모델을 공개했기 때문입니다. 바로 ‘제미나이 2.5 TTS’입니다. 구글에 따르면 이번 업데이트는 기존 모델을 완전히 갈아엎는 수준의 대규모 업그레이드라고 합니다. 단순히 글자를 읽는 것을 넘어 감정과 뉘앙스까지 완벽하게 표현한다고 합니다.

진짜 사람 아니야? 소름 돋는 감정 연기

이번 발표의 핵심은 바로 AI의 ‘연기력’이 엄청나게 좋아졌다는 점입니다. 예전 AI는 슬픈 내용이든 기쁜 내용이든 똑같은 톤으로 읽었습니다. 하지만 제미나이 2.5 TTS는 다릅니다. 사용자가 ‘밝고 신나는 톤으로 읽어줘’라거나 ‘진지하고 침착하게 말해줘’라고 명령하면 그 느낌을 그대로 살려냅니다. 심지어 문장의 맥락까지 이해해서 말하기 속도를 조절합니다. 농담을 할 때는 타이밍을 맞춰서 툭 던지기도 하고요. 복잡한 설명을 할 때는 천천히, 긴박한 액션 장면에서는 빠르게 말합니다. 마치 전문 성우가 대본을 분석해서 연기하는 것과 똑같습니다. 구글 딥마인드 관계자에 따르면 롤플레잉 게임 캐릭터나 가상 비서의 목소리가 훨씬 더 자연스러워질 것이라고 합니다.

여러 명 목소리도 한 번에 뚝딱

보통 오디오북이나 팟캐스트를 만들 때 등장인물이 여러 명이면 골치가 아팠습니다. 성우를 여러 명 쓰거나 AI 설정을 일일이 바꿔야 했기 때문입니다. 그런데 이번 모델은 혼자서 다역을 완벽하게 소화합니다. 서로 다른 캐릭터의 목소리 톤과 말투를 유지하면서 자연스럽게 대화를 주고받습니다. 실제로 AI 오디오 플랫폼인 ‘원더크래프트’는 이 기술을 도입하고 나서 구독자가 20%나 늘었다고 합니다. 비용도 20%나 줄어들었고요. 인도의 한 웹툰 회사는 캐릭터마다 딱 맞는 억양과 악센트를 AI가 완벽하게 표현해서 깜짝 놀랐다는 반응을 보였습니다. 이제 혼자서도 라디오 드라마 한 편을 뚝딱 만들 수 있게 된 셈입니다.

이제 누구나 쉽게 만드는 고퀄리티 음성

이번 기술은 단순히 신기한 것을 넘어 콘텐츠 시장에 큰 변화를 가져올 것으로 보입니다. 개발자들은 구글이 공개한 API를 통해 이 기능을 바로 자신의 앱이나 서비스에 넣을 수 있습니다. 쇼피파이 같은 글로벌 기업들도 이미 이 기술을 쓰고 있습니다. 시끄러운 환경에서도 사람 목소리를 정확히 알아듣고 자연스럽게 대화하는 AI 상담원을 만들고 있습니다. 구글이 제공하는 문서와 가이드를 보면 누구나 쉽게 고품질 음성을 만들 수 있게 되어 있습니다. 앞으로 우리가 듣는 유튜브 내레이션이나 게임 속 목소리의 대부분이 AI로 바뀔지도 모릅니다. 기술이 발전할수록 진짜 사람 목소리와 AI 목소리를 구분하기 더 어려워질 것입니다. 창작자들에게는 축복이지만 성우들에게는 위기가 될 수도 있겠습니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 성우, 사람 성우를 완전히 대체할까?

댓글 0