환영해🦉
기술/연구

“동시 접속 5배 폭증” 엔비디아, 초고속 음성 AI 공개

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.01.11 20:25
“동시 접속 5배 폭증” 엔비디아, 초고속 음성 AI 공개

기사 3줄 요약

  • 1 엔비디아, 초고속 음성 AI 네모트론 공개
  • 2 캐시 기술로 지연 줄이고 처리량 5배 급증
  • 3 허깅페이스에 무료 공개해 AI 생태계 확장
AI와 대화하다가 답변이 늦어서 답답했던 경험, 다들 한 번쯤 있으시죠? 엔비디아가 이 ‘버퍼링’ 문제를 시원하게 해결할 새로운 기술을 들고 나왔습니다. 바로 실시간 음성 인식 모델인 ‘네모트론 스피치 ASR’입니다. 엔비디아 발표에 따르면, 이 모델은 지연 시간을 확 줄이고 동시에 여러 사람의 목소리를 처리할 수 있다고 합니다. 이제 AI와의 대화가 사람과 이야기하는 것처럼 자연스러워질 전망입니다.

책장 다시 읽기는 이제 그만

기존의 음성 인식 기술은 마치 책을 읽는 것과 비슷했습니다. 문맥을 파악하기 위해 이미 읽었던 앞 페이지를 계속 다시 읽어야 했죠. 이걸 ‘오버랩 윈도우’ 방식이라고 하는데, 문제는 계산량이 많아지고 속도가 느려진다는 점입니다. 하지만 네모트론은 ‘캐시’라는 기억 저장소를 활용합니다. 한번 처리한 음성 정보는 저장해두고, 새로운 목소리가 들리면 그 부분만 계산하는 방식입니다. 덕분에 중복 계산이 사라져서 처리 속도가 비약적으로 빨라졌습니다.

속도와 정확도 두 마리 토끼 잡다

이 기술 덕분에 성능은 놀라울 정도로 향상되었습니다. 엔비디아의 테스트 결과에 따르면, ‘RTX A5000’ 그래픽카드 기준으로 기존 방식보다 처리량이 5배 이상 늘어났다고 합니다. 동시에 수백 명이 접속해도 버벅거리지 않는다는 뜻입니다. 정확도 또한 놓치지 않았습니다. 약 28만 시간 분량의 방대한 음성 데이터를 학습시켜 단어 오류율을 7%대로 낮췄습니다. 상황에 따라 응답 속도를 4가지 모드로 조절할 수 있어 활용도도 매우 높습니다.

누구나 쓸 수 있는 기술

더 놀라운 점은 엔비디아가 이 기술을 ‘허깅페이스’에 오픈 소스로 공개했다는 사실입니다. 개발자라면 누구나 무료로 가져다 쓸 수 있게 된 것입니다. 이는 엔비디아가 AI 생태계에서의 영향력을 더욱 넓히려는 전략으로 풀이됩니다. 앞으로 통역 서비스나 라이브 자막 방송이 얼마나 더 빨라질지 기대가 됩니다. 네모트론의 등장으로 실시간 음성 비서 시장의 판도가 완전히 바뀔 것으로 보입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 음성인식 기술, 속도와 정확도 중 뭐가 더 중요?

댓글 0