환영해🦉
기술/연구

“내 비밀 다 털릴라..” 폰에서만 도는 AI 비서 드디어 등장

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.02.06 15:10
“내 비밀 다 털릴라..” 폰에서만 도는 AI 비서 드디어 등장

기사 3줄 요약

  • 1 미스트랄, 폰에서 도는 음성 AI 출시
  • 2 가격 1/5 수준에 보안 걱정 원천 차단
  • 3 오픈소스 공개로 기업 시장 판도 변화
혹시 친구와 대화하던 내용이 다음 날 스마트폰 광고에 떠서 소름 돋았던 경험이 한 번쯤은 있을 겁니다. 내 목소리가 어딘가로 전송되고 있다는 불안감 때문인데, 이제 그런 걱정을 덜어줄 기술이 등장했습니다. 프랑스의 AI 기업 미스트랄이 인터넷 연결 없이 기기 자체에서 작동하는 새로운 음성 인식 모델을 공개했기 때문입니다. 내 정보를 지키면서도 훨씬 저렴하게 사용할 수 있는 이 기술이 AI 시장의 판도를 어떻게 바꿀지 주목받고 있습니다.

“내 정보는 내 폰에”

미스트랄이 공개한 ‘복스트럴 트랜스크라이브 2’는 스마트폰이나 노트북 안에서 모든 음성 처리를 끝내는 것이 가장 큰 특징입니다. 보통 우리가 쓰는 음성 AI는 목소리를 녹음해서 거대한 클라우드 서버로 보낸 뒤, 결과를 다시 받아오는 방식을 사용합니다. 이 과정에서 인터넷이 끊기면 먹통이 되거나, 민감한 대화 내용이 서버에 남을 수 있다는 보안 우려가 항상 존재했습니다. 하지만 미스트랄의 새 모델은 외부 서버로 데이터를 보낼 필요가 없어 해킹이나 유출 걱정에서 자유롭습니다. 특히 병원에서 환자의 진료 기록을 정리하거나, 기업의 기밀 회의 내용을 기록할 때 매우 유용할 것으로 보입니다. 피에르 스톡 미스트랄 부사장은 “자신의 음성은 사용자 가장 가까이에 있어야 한다”며 보안의 중요성을 강조하기도 했습니다.

“성능은 올리고 가격은 내렸다”

놀라운 점은 이 모델이 작고 가벼우면서도 성능은 강력하다는 것입니다. 업계 발표에 따르면, 이 모델은 40억 개의 매개변수를 가지고 있어 스마트워치 같은 작은 기기에도 탑재가 가능합니다. 가격 경쟁력 또한 압도적입니다. 녹음된 파일을 글로 바꿔주는 비용이 분당 약 0.003달러 수준인데, 이는 현재 시장을 장악하고 있는 경쟁사들의 5분의 1 가격에 불과합니다. 실시간 통역이나 자막 생성에 쓰이는 ‘리얼타임’ 모델은 지연 시간을 0.2초 수준으로 줄였습니다. 사람이 말하는 것과 거의 동시에 자막이 뜨는 수준이라 고객 상담이나 동시통역 서비스에서 큰 활약이 기대됩니다.

“현장 소음까지 걸러낸다”

미스트랄은 단순히 말을 글로 바꾸는 것을 넘어, 실제 현장에서 겪는 문제들도 해결하려고 노력했습니다. 시끄러운 공장이나 카페에서도 정확하게 목소리만 골라내 기록하는 기능을 강화한 것입니다. 특히 ‘컨텍스트 바이어싱’이라는 기술이 눈에 띕니다. 이는 사용자가 미리 입력해 둔 전문 용어나 회사 제품명을 AI가 우선적으로 인식하게 만드는 기능입니다. 예를 들어, 의사가 복잡한 의학 용어를 빠르게 말해도 AI가 찰떡같이 알아듣고 정확히 기록해 주는 식입니다. 별도의 복잡한 학습 과정 없이 설정만 하면 바로 쓸 수 있어 기업들에게 큰 호응을 얻을 것으로 보입니다. 이 기술은 누구나 자유롭게 수정하고 쓸 수 있는 ‘오픈소스’로 공개되었습니다. 앞으로 이 기술을 활용해 인터넷 없이도 작동하는 통역 이어폰이나, 나만의 비밀 비서 앱 같은 다양한 서비스가 쏟아져 나올 것으로 전망됩니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 음성비서, 보안 vs 성능 뭐가 더 중요?

댓글 0