“이제 성우 필요 없다?” 구글, 감정 섞인 목소리 기능 출시
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.02.07 09:17
기사 3줄 요약
- 1 구글, 감정 연기하는 제미나이 2.5 TTS 공개
- 2 문맥 파악해 속도 조절하는 지능형 기능 탑재
- 3 성우 위협할 고품질 음성 기술로 업계 주목
사람보다 더 사람 같은 목소리가 등장했습니다.
구글이 인공지능(AI) 음성 기술의 판도를 뒤집을 새로운 모델을 공개했습니다. 바로 ‘제미나이 2.5 플래시 TTS’와 ‘제미나이 2.5 프로 TTS’입니다. 이번 업데이트는 단순한 성능 개선 수준이 아닙니다. AI가 텍스트를 읽을 때 감정을 섞고, 상황에 맞춰 말하는 속도까지 조절합니다.
기존의 기계적인 음성 안내와는 차원이 다릅니다. 성우가 직접 연기하는 것처럼 자연스러운 목소리를 구현했습니다. 구글의 발표에 따르면, 이번 기술은 개발자들이 목소리의 스타일과 톤을 자유자재로 다룰 수 있게 해줍니다. 실제 성우들의 설 자리가 위협받을 정도라는 평가가 나옵니다.
실제로 이 기술을 도입한 기업들의 성과는 놀랍습니다. AI 오디오 플랫폼 ‘원더크래프트’는 제미나이 TTS를 사용한 뒤 구독자가 20% 늘었습니다. 반면 비용은 20%나 줄었습니다. 인도 콘텐츠 기업 ‘툰수트라’ 역시 웹툰 캐릭터 음성 연출에 이 기술을 활용해 호평을 받았습니다.
이제 누구나 구글 AI 스튜디오를 통해 이 놀라운 기술을 활용할 수 있습니다. 나만의 오디오북을 만들거나, 게임 캐릭터에게 생명을 불어넣는 일이 훨씬 쉬워질 전망입니다.
감정까지 연기한다고?
이번 모델의 가장 큰 특징은 ‘표현력’입니다. 사용자가 원하는 분위기를 말하면 AI가 그대로 연기합니다. 예를 들어 “밝고 희망차게 읽어줘”라고 하면 들뜬 목소리로 말합니다. 반대로 “침착하고 진지하게”라고 주문하면 뉴스 앵커처럼 차분하게 바뀝니다. 게임 캐릭터의 대사나 오디오북의 내레이션도 완벽하게 소화합니다. 구글은 이번 기술이 롤플레잉 게임이나 가상 비서 서비스의 품질을 획기적으로 높일 것이라고 설명했습니다. 단순히 글자를 소리로 바꾸는 것이 아니라, 상황에 맞는 연기가 가능해졌기 때문입니다.눈치 챙겨서 말 속도 조절해
사람은 대화할 때 상황에 따라 말하는 속도를 다르게 합니다. 농담할 때는 타이밍을 맞추고, 어려운 내용을 설명할 때는 천천히 말합니다. 제미나이 2.5 TTS는 이런 ‘눈치’까지 갖췄습니다. 문장의 구조와 맥락을 이해해서 스스로 말하기 속도를 조절합니다. 복잡한 설명은 천천히 또박또박 읽어줍니다. 반면 긴박한 액션 장면 묘사는 빠르게 속사포처럼 쏟아냅니다. 개발자가 직접 “느리게”, “더 빠르게”라고 지시할 수도 있습니다. 이 기능 덕분에 팟캐스트나 교육 영상에서 훨씬 자연스러운 흐름을 만들 수 있습니다. 듣는 사람 입장에서는 AI가 말한다는 이질감이 거의 느껴지지 않습니다.여러 명 목소리도 한 번에
한 사람이 여러 명의 목소리를 내는 ‘다중 화자’ 기능도 강력해졌습니다. 이야기 속에 등장하는 여러 캐릭터의 목소리를 서로 다르게 표현합니다.| 기능 구분 | 주요 특징 |
|---|---|
| 표현력 | 사용자 지시에 따른 감정 및 톤 연기 |
| 속도 제어 | 문맥 파악해 말하기 속도 자동 조절 |
| 다중 화자 | 여러 캐릭터 목소리 구분 및 자연스러운 전환 |
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 음성 기술, 성우 직업을 대체해도 괜찮은가?
괜찮다
0%
0명이 투표했어요
안 된다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사