“성우들 진짜 큰일 났다” 구글 제미나이 2.5, 감정 연기 충격
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.02.03 21:37
기사 3줄 요약
- 1 구글 제미나이 2.5 TTS 공개해 기술 혁신
- 2 감정 연기부터 속도 조절까지 사람 목소리 완벽 구현
- 3 콘텐츠 제작 비용 줄이고 품질 높이는 새로운 대안
이제는 AI가 쓴 대본을 AI가 읽어주는 시대가 정말 코앞으로 다가왔습니다. 그것도 로봇 같은 딱딱한 목소리가 아니라, 상황에 맞춰 울고 웃는 사람 같은 목소리로 말입니다.
구글이 최근 발표한 기술을 보면, 우리가 알던 그 어색한 기계음은 이제 옛말이 될지도 모르겠습니다.
“이제 진짜 사람인지 기계인지 헷갈리네”
구글이 야심 차게 공개한 ‘제미나이 2.5 TTS’는 텍스트를 음성으로 바꿔주는 기술의 끝판왕이라고 불리고 있습니다. 구글의 발표에 따르면, 이번 업데이트는 단순히 글자를 소리로 바꾸는 수준을 넘어섰다고 합니다. 이 모델은 문장의 맥락을 완벽하게 이해하고, 그에 맞는 감정을 목소리에 실어 보냅니다. 예를 들어 슬픈 이야기를 할 때는 목소리가 떨리거나 가라앉고, 신나는 이야기를 할 때는 톤이 한껏 올라갑니다. 개발자가 ‘밝고 낙관적인 톤’이나 ‘침착하고 진지한 톤’으로 읽으라고 명령하면, AI가 배우처럼 연기 톤을 조절하기도 합니다. 단순히 정보를 전달하는 내비게이션 목소리가 아니라, 드라마나 영화 속 성우처럼 연기를 하는 셈입니다.“눈치까지 챙긴 똑똑한 AI 성우”
이번 기술에서 가장 놀라운 점은 AI가 말하는 속도를 스스로 조절한다는 것입니다. 농담을 던질 때는 사람들이 웃을 타이밍을 위해 잠시 멈추기도 하고, 복잡한 설명을 할 때는 천천히 또박또박 말합니다. 반대로 긴박한 액션 장면을 묘사할 때는 말이 빨라지며 긴장감을 조성하기도 합니다. 기존의 기계적인 음성 기술은 문장 구조와 상관없이 일정한 속도로 읽어내려가는 경우가 많았습니다. 하지만 제미나이 2.5는 문장의 분위기 파악을 끝내고, 마치 사람이 대화하듯 자연스러운 리듬을 만들어냅니다. 게다가 여러 명의 화자가 등장하는 대화 장면에서도 각각의 캐릭터 목소리를 완벽하게 구사하며 자연스럽게 주고받습니다.“콘텐츠 제작비 확 줄어든다”
이 기술은 이미 실제 산업 현장에서 돈을 벌어다 주고 있습니다. 오디오 제작 플랫폼인 원더크래프트에 따르면, 제미나이 TTS를 도입한 후 비용이 무려 20%나 절감되었다고 합니다. 성우를 섭외하고 스튜디오를 빌려 녹음하는 과정 없이, 클릭 몇 번으로 고품질의 음성을 만들어낼 수 있기 때문입니다. 인도의 웹툰 기업 툰수트라 역시 캐릭터 목소리 연출에 이 기술을 사용해 큰 효과를 봤다고 전했습니다. 이제 1인 크리에이터나 소규모 제작사도 비싼 비용을 들이지 않고 프로 수준의 더빙 콘텐츠를 만들 수 있게 된 것입니다. 하지만 이런 기술 발전이 전문 성우들의 일자리를 위협할 수 있다는 우려의 목소리도 함께 나오고 있습니다. 기술의 발전이 우리에게 편리함을 주는 동시에, 누군가의 직업을 사라지게 할 수도 있다는 사실을 기억해야 합니다. 앞으로 이 AI 목소리가 어디까지 진화할지, 그리고 우리 삶에 어떤 변화를 가져올지 계속 지켜봐야겠습니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 성우, 인간 성우를 완전히 대체할까?
대체 가능
0%
0명이 투표했어요
대체 불가
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사