기술/연구

“내 목소리 3초면 복제?” 미스트랄 신형 음성 AI 무료 공개

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.03.27 16:36

기사 3줄 요약

1 미스트랄 AI가 고성능 음성 생성 모델을 무료 공개함
2 3초 샘플로 목소리 복제하며 유료 모델보다 뛰어남
3 스마트폰에서 작동하는 가벼운 무게와 빠른 속도가 특징

프랑스의 대표적인 인공지능 기업인 미스트랄 AI가 놀라운 기술을 선보였습니다. 텍스트를 사람의 목소리로 바꿔주는 새로운 모델인 복스트랄 TTS를 전격 공개했습니다. 이번 모델은 누구나 코드를 볼 수 있는 오픈소스 기술로 출시되었습니다. 이제 기업들은 비싼 비용을 내지 않고도 고성능 음성 기술을 쓸 수 있게 되었습니다.

목소리 복제 실력이 이정도라고

복스트랄 TTS는 단순히 글을 읽어주는 수준을 넘어섰습니다. 사람의 감정과 문맥을 이해하여 아주 자연스러운 목소리를 만들어냅니다. 겨우 몇 초 분량의 음성 샘플만 있으면 됩니다. 특정 사람의 말투와 개성을 그대로 따라 하는 음성 복제가 가능합니다. 실제로 진행된 블라인드 테스트 결과에 따르면 성능이 대단합니다. 기존 유료 서비스인 일레븐랩스의 모델보다 더 뛰어나다는 평가를 받았습니다. 현재 영어와 프랑스어 등 총 9개 언어를 지원합니다. 한국어는 아직 포함되지 않았지만 향후 업데이트가 기대되는 부분입니다.

작고 가벼운데 속도는 더 빨라

이 모델의 가장 큰 장점은 바로 효율성입니다. 40억 개의 매개변수를 가진 경량 모델로 설계되었습니다. 슈퍼컴퓨터가 없어도 스마트폰이나 노트북에서 직접 구동할 수 있습니다. 덕분에 비싼 클라우드 서버 비용을 획기적으로 줄일 수 있습니다. 응답 속도 역시 눈부시게 빠릅니다. 미스트랄 AI의 발표 자료에 따르면 음성 출력까지 걸리는 시간은 0.1초도 안 됩니다. 실시간 상담이나 대화형 서비스에 사용하기에 아주 적합합니다. 끊김 없는 자연스러운 대화가 가능해지기 때문입니다.

기업들이 환호하는 진짜 이유

미스트랄 AI는 모델의 핵심 데이터를 모두 공개하는 전략을 택했습니다. 이를 통해 기업들은 데이터 보안을 완벽하게 지킬 수 있습니다. 민감한 음성 데이터를 외부 서버로 보낼 필요가 없습니다. 금융이나 의료처럼 보안이 중요한 분야에서 특히 반길 소식입니다. 회사의 특성에 맞춘 음성 비서를 직접 만들기도 쉽습니다. 외부 서비스에 의존하지 않고 자체적으로 기술을 통제할 수 있습니다.

항목	주요 내용
모델 특징	40억 매개변수 경량 오픈소스
지원 언어	영어 및 프랑스어 등 9개 국어
응답 속도	70에서 90밀리초 수준
배포 방식	허깅페이스 통해 가중치 공개

이번 기술 공개로 음성 인공지능 시장의 판도가 바뀔 전망입니다. 더 많은 기업이 인공지능을 활용해 혁신적인 서비스를 내놓을 것으로 보입니다.