“사람보다 더 사람 같다?” 구글 제미나이 2.5 목소리 충격
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.02.12 20:47
기사 3줄 요약
- 1 구글 제미나이 2.5 TTS 공개, 감정 표현 대폭 강화
- 2 속도와 억양 자유자재 조절, 성우 뺨치는 AI 등장
- 3 오디오북부터 게임까지, 콘텐츠 제작 판도 바뀐다
로봇처럼 딱딱하게 책을 읽어주던 인공지능(AI) 목소리는 이제 잊어야 할 것 같습니다.
구글이 사람보다 더 사람 같은 목소리를 내는 새로운 기술을 공개했기 때문입니다.
이번 발표는 단순한 기능 업데이트를 넘어, 성우나 내레이터의 영역까지 넘보는 충격적인 변화를 예고하고 있습니다.
구글은 최근 자사의 AI 음성 합성 기술을 획기적으로 업그레이드한 ‘제미나이 2.5 플래시 TTS’와 ‘제미나이 2.5 프로 TTS’ 모델을 세상에 내놨습니다.
내 마음대로 조종하는 성우
이번 기술의 가장 큰 특징은 AI에게 마치 연기 지도를 하듯 구체적인 지시를 내릴 수 있다는 점입니다. 사용자가 ‘밝고 명랑하게’ 또는 ‘진지하고 침착하게’라고 요청하면 AI가 그 감정을 그대로 살려 목소리를 만들어냅니다. 심지어 게임 캐릭터의 연기 톤이나 마케팅 영상에 어울리는 활기찬 목소리까지 자유자재로 구현할 수 있습니다. 기존에는 단순히 글자를 소리로 바꾸는 데 그쳤다면, 이제는 상황에 맞는 ‘연기’가 가능해진 것입니다. 구글에 따르면 이번 모델은 개발자가 원하는 목소리 스타일과 톤을 이전보다 훨씬 정교하게 제어할 수 있도록 설계되었습니다.눈치까지 챙긴 똑똑한 AI
더 놀라운 점은 AI가 문맥을 파악해 말하는 속도를 스스로 조절한다는 사실입니다. 웃긴 농담을 할 때는 타이밍을 맞추고, 복잡한 내용을 설명할 때는 천천히 말하며, 긴박한 액션 장면에서는 속도감 있게 읽어 내려갑니다. 마치 사람이 대화의 분위기에 맞춰 호흡을 조절하는 것과 똑같은 원리입니다. 여러 명이 대화하는 팟캐스트나 인터뷰 형식의 콘텐츠도 문제없습니다. AI가 서로 다른 캐릭터의 목소리를 구분해 연기하며, 화자가 바뀔 때도 전혀 어색함 없이 자연스럽게 이어집니다.콘텐츠 제작 시장의 지각변동
이번 기술은 실제 콘텐츠 제작 현장에서 이미 엄청난 효율을 증명하고 있습니다. 음성 콘텐츠 제작 플랫폼인 원더크래프트에 따르면, 제미나이 TTS 도입 후 제작 비용이 20%나 줄어들었습니다. 동시에 사용자 구독률은 20%나 증가하는 놀라운 성과를 거뒀습니다. 인도의 웹툰 기업 툰수트라 역시 캐릭터의 성격에 맞는 억양과 톤을 완벽하게 구현한다며 호평했습니다. 이제 누구나 전문 성우 없이도 고품질의 오디오북, 교육 영상, 게임 더빙을 만들 수 있는 시대가 열렸습니다. 구글의 이번 혁신이 앞으로 우리의 귀를 얼마나 더 즐겁게 해줄지, 혹은 성우들의 일자리를 위협하게 될지 지켜봐야 할 대목입니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 음성, 성우 일자리 위협할까?
위협한다
0%
0명이 투표했어요
공존한다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사