“이게 사람 목소리가 아니라고?” 구글 제미나이 2.5 충격
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.02.16 04:27
기사 3줄 요약
- 1 구글, 감정 담은 제미나이 2.5 음성 모델 공개
- 2 로봇 톤 벗고 웃고 우는 AI 목소리 등장
- 3 원더크래프트 등 콘텐츠 업계 비용 20% 절감
이제 인공지능이 인간의 감정까지 완벽하게 연기하는 시대가 열렸습니다. 구글이 사람의 목소리와 구별하기 힘들 정도로 정교한 AI 음성 기술을 세상에 내놓았습니다.
구글은 최근 자사의 최신 음성합성 기술인 '제미나이 2.5 TTS' 모델을 공개했습니다. 이번 모델은 단순한 문장 읽기를 넘어 상황에 맞는 감정과 속도 조절까지 가능합니다. 업계에서는 성우들의 설자리가 위협받을 정도라는 평가가 나옵니다.
로봇 말투 벗어던진 AI
기존의 TTS(Text-to-Speech) 기술은 글자를 소리로 바꿀 때 특유의 딱딱한 기계음이 섞여 있었습니다. 하지만 이번 제미나이 2.5 모델은 이러한 한계를 완전히 뛰어넘었습니다. 사용자가 '밝은 톤'이나 '진지한 톤'을 요구하면 AI가 이를 즉각 반영해 목소리를 생성합니다. 심지어 농담을 할 때는 타이밍을 맞춰 능청스럽게 말하기도 합니다. 복잡한 설명을 할 때는 천천히 말하고, 긴박한 액션 장면에서는 말이 빨라지는 등 속도 조절 능력도 탁월합니다. 이는 문맥을 파악하는 AI의 지능이 음성 기술과 결합된 결과입니다.기업들이 먼저 알아본 효율성
실제 산업 현장에서는 이미 이 기술을 도입해 놀라운 성과를 거두고 있습니다. AI 오디오 플랫폼 기업인 원더크래프트의 사례가 대표적입니다. 원더크래프트 측 발표에 따르면 제미나이 2.5 TTS 도입 후 운영 비용이 약 20퍼센트 절감되었습니다. 동시에 서비스 구독률은 20퍼센트 증가하는 효과를 봤습니다. 인도 콘텐츠 기업 툰수트라 역시 이 기술을 웹툰 캐릭터 음성에 활용하고 있습니다. 여러 캐릭터가 등장해도 각기 다른 목소리와 톤을 일관되게 유지하는 능력이 호평을 받았습니다.누구나 성우를 고용하는 시대
구글은 이번 기술을 API 형태로 공개해 개발자들이 쉽게 활용할 수 있도록 했습니다. 이제 개인 창작자도 비싼 성우 녹음 비용 없이 고품질의 오디오 콘텐츠를 만들 수 있습니다. 오디오북이나 교육 자료, 마케팅 영상 등 다양한 분야에서 AI 음성의 활용도가 폭발적으로 늘어날 전망입니다. 기술의 발전이 콘텐츠 제작의 진입 장벽을 낮추고 있습니다. 전문가들은 AI 음성 기술이 인간의 감정선까지 건드리는 수준에 도달했다고 입을 모읍니다. 앞으로 인간 성우와 AI 성우의 공존 방식에 대한 논의가 더욱 활발해질 것으로 보입니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 음성 기술, 성우 일자리 위협할까?
위협한다
0%
0명이 투표했어요
공존한다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사