환영해🦉
기술/연구

“10초만 말하던 AI는 끝났다” 24시간 대화하는 한국산 AI 비서의 등장

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.07.03 11:23
“10초만 말하던 AI는 끝났다” 24시간 대화하는 한국산 AI 비서의 등장

기사 3줄 요약

  • 1 KAIST, 24시간 대화 가능한 음성 AI ‘스피치SSM’ 개발
  • 2 기존 AI의 단기 기억 문제, 하이브리드 모델로 완벽 해결
  • 3 오디오북, AI 비서 등 장시간 음성 서비스 혁신 기대
AI 비서에게 긴 이야기를 하면 금방 대화가 엉키는 경험, 다들 한 번쯤 있으실 겁니다. 이제 24시간 막힘없이 대화하고 책 한 권을 읽어주는 AI 비서의 등장이 머지않았습니다. KAIST 연구진이 오랜 시간 일관성 있게 말하는 인공지능(AI) 기술 ‘스피치SSM’을 개발해 전 세계의 주목을 받고 있습니다. 이 기술은 차세대 AI의 새로운 가능성을 열었다는 평가입니다.

기존 AI는 왜 길게 말을 못 했을까?

지금까지의 음성 AI는 사람처럼 긴 대화를 나누는 데 뚜렷한 한계가 있었습니다. 대화가 조금만 길어져도 앞서 했던 말을 쉽게 잊어버리고 엉뚱한 대답을 내놓기 일쑤였습니다. 가장 큰 원인은 메모리 문제였습니다. 처리해야 할 음성 정보량이 대화 길이에 따라 기하급수적으로 불어났기 때문입니다. 결국 메모리 한계에 부딪혀 대화의 전체 흐름을 놓치는, 마치 단기 기억상실증 같은 문제를 보인 것입니다. 이 때문에 팟캐스트나 오디오북 서비스에는 적용하기 어려웠습니다.

KAIST는 어떻게 이 문제를 해결했지?

KAIST 연구팀은 기존의 방식을 버리고 새로운 접근법을 택했습니다. 최근 정보에 집중하는 ‘어텐션’ 기능과 전체 흐름을 기억하는 ‘순환’ 기능을 똑똑하게 합친 하이브리드 모델을 개발했습니다. 이는 단기 기억과 장기 기억을 모두 잘하는 뇌처럼 작동합니다. 덕분에 AI는 아주 긴 시간 동안 대화의 핵심 맥락을 잃지 않고 일관된 이야기를 이어갈 수 있게 됐습니다. 여기에 구글 딥마인드의 ‘사운드스톰’ 기술을 활용해 음성도 매우 빠르게 만들어냅니다. 느리고 비효율적이던 기존 방식의 단점을 극복한 것입니다.

그래서 이게 얼마나 대단한 건데?

연구팀의 ‘스피치SSM’은 실제로 16분 이상 쉬지 않고 주제를 벗어나지 않으며 대화를 이어가는 데 성공했습니다. 기존 모델들이 10초도 버티기 힘들어했던 것과 비교하면 엄청난 기술적 도약입니다. 이 성과는 세계 최고 권위 머신러닝 학회 ICML에서 상위 1%만 가능한 구두 발표로 선정되며 우수성을 입증했습니다. 앞으로 이 기술은 24시간 소통하는 개인 비서는 물론, 감정을 담아 책을 읽어주는 AI 성우 등 다양한 분야에서 혁신을 가져올 것으로 기대됩니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

24시간 대화하는 AI, 축복일까 재앙일까?

댓글 0

관련 기사