“OpenAI 긴장해라…” 프랑스산 괴물 음성 AI, 오픈소스로 풀렸다
댓글 1
·
저장 0
·
편집: 이도윤 기자
발행: 2025.07.16 18:11

기사 3줄 요약
- 1 프랑스 미스트랄AI, 오픈소스 음성 모델 '복스트랄' 공개
- 2 오픈AI '위스퍼'보다 저렴하고 뛰어난 성능으로 도전장
- 3 단순 음성인식을 넘어 요약, 질문까지 가능한 AI 모델
프랑스의 인공지능(AI) 기업 미스트랄AI가 시장의 판을 뒤흔들 새로운 음성 AI 모델 ‘복스트랄(Voxtral)’을 공개했습니다. 이 모델은 누구나 자유롭게 사용할 수 있는 오픈소스로 공개되어, OpenAI 같은 거대 기업의 독점 구도에 도전장을 내밀었습니다.
복스트랄은 단순한 음성 받아쓰기를 넘어 질문에 답하고, 긴 내용을 요약하며, 특정 명령까지 수행하는 ‘음성 이해 모델’입니다. 무엇보다 오픈AI의 유명 음성 모델 ‘위스퍼’보다 비용은 저렴하면서도 정확도는 더 뛰어나다는 점에서 시장에 큰 파장을 일으키고 있습니다.
그래서 뭐가 다른데?
복스트랄은 크게 두 가지 버전으로 출시되었습니다. 전문가용 고성능 모델과 일반 장치에서도 가볍게 구동되는 소형 모델입니다. 둘 다 ‘아파치 2.0 라이선스’에 따라 기업이나 개발자가 상업적으로도 자유롭게 활용할 수 있습니다. 미스트랄 측은 자체 성능 평가(벤치마크) 결과를 공개하며 자신감을 보였습니다. 여러 영어 성능 테스트에서 기존 오픈소스 모델 중 가장 낮은 오류율을 기록했습니다. 이는 복스트랄이 그냥 공짜 모델이 아니라, 성능 면에서도 최고 수준임을 증명합니다.모델 | 단어 오류율 (WER, 낮을수록 좋음) |
---|---|
복스트랄 스몰 | 5.2% |
오픈AI 위스퍼 Large V2 | 5.8% |
일레븐랩스 스크라이브 | 6.5% |
누구나 쓸 수 있다고?
가장 큰 특징은 ‘오픈소스’라는 점입니다. 이는 개발자들이 복스트랄의 핵심 기술을 직접 보고 수정하며 자신에게 맞는 음성 AI 서비스를 만들 수 있다는 의미입니다. 최대 40분 길이의 음성 파일을 처리할 수 있고, 영어, 독일어, 힌디어 등 다양한 언어를 자동으로 인식합니다. 또한 기업 고객을 위한 고급 기능도 지원합니다. 외부 서버를 거치지 않고 회사 내부망에서 안전하게 AI를 운영하거나, 의료나 법률 같은 특정 전문 분야에 맞게 AI를 추가로 학습시키는 것도 가능합니다.소문난 잔치, 먹을 건 있을까?
미스트랄 AI는 복스트랄을 자사의 AI 챗봇 서비스인 ‘르샤(Le Chat)’에도 적용해 일반 사용자들도 음성을 녹음하거나 파일을 올려 바로 써볼 수 있게 했습니다. 앞으로는 목소리 주인공을 구분하거나, 말하는 사람의 감정을 읽는 기능까지 추가할 계획입니다. 미스트랄AI는 “복스트랄을 통해 누구나 강력한 음성 지능 시스템을 만들 수 있게 됐다”고 강조했습니다. 폐쇄적인 고가 모델이 주도하던 음성 AI 시장에, 강력한 성능의 오픈소스 모델이 등장하면서 앞으로 치열한 기술 경쟁이 예상됩니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 1오픈소스 음성AI, 기술 발전에 도움될까?
도움된다
0%
0명이 투표했어요
위험하다
0%
0명이 투표했어요
관련 기사
최신 기사




프랑스도가즈아