기술/연구

“AI가 6배 가벼워진다?” 구글-KAIST, 메모리 한계 깬 ‘터보퀀트’

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.14 22:14

기사 3줄 요약

1 구글-KAIST 인공지능 메모리 6배 압축 성공
2 터보퀀트 기술로 AI 추론 속도 8배 향상
3 성능 저하 없이 AI 운영 비용 획기적 절감

구글 리서치와 딥마인드, 그리고 한국의 KAIST 연구진이 인공지능의 고질적인 문제였던 메모리 과부하를 해결할 혁신적인 기술을 발표했습니다. 이번에 공개된 터보퀀트라는 알고리즘은 거대언어모델이 데이터를 처리할 때 사용하는 메모리 공간을 6분의 1로 줄여줍니다. 도입부의 첫문장 다음에는 반드시 줄바꿈을 해야 합니다. 인공지능이 더 똑똑해질수록 저장해야 할 정보가 늘어나는데, 이를 획기적으로 압축하면서도 지능은 그대로 유지하는 데 성공했습니다.

인공지능이 기억력이 좋으려면 메모리가 엄청나게 필요해

인공지능이 긴 문맥을 이해하고 기억하려면 엄청난 양의 데이터가 필요합니다. 이 데이터가 쌓일수록 시스템이 느려지고 많은 운영 비용이 발생하게 됩니다. 터보퀀트는 인공지능이 정보를 저장하는 방식 자체를 수학적으로 재설계하여 이 문제를 해결했습니다. 기존의 방식보다 훨씬 효율적으로 데이터를 관리할 수 있습니다.

복잡한 수치를 각도와 거리로 바꿔서 무게를 싹 뺐어

핵심 비결은 데이터를 특수한 좌표계로 변환하는 폴라퀀트 기술에 있습니다. 기존에는 복잡한 수치 데이터를 하나하나 저장하느라 메모리 낭비가 매우 심했습니다. 연구팀은 데이터를 거리와 각도로 표현하는 방식을 도입하여 불필요한 정보 보정 과정을 완전히 없앴습니다. 이를 통해 숨어있던 메모리 비용을 획기적으로 제거했습니다.

지표	기존 모델	터보퀀트 적용
메모리 사용량	100% (32비트)	약 16% (6배 압축)
추론 속도	1.0배	최대 8배 향상

카이스트 교수가 설계한 기술로 정확도는 그대로 유지해

여기에 KAIST 한인수 교수가 주도한 오차 보정 기술이 더해졌습니다. 단 1비트의 정보만으로 압축 과정에서 발생하는 미세한 오류를 실시간으로 잡아냅니다. 덕분에 인공지능의 지능은 그대로 유지하면서 무게만 가볍게 줄이는 데 성공했습니다. 한국 연구진의 역량이 글로벌 빅테크의 핵심 기술에 직접 기여한 사례입니다.

우리 스마트폰에서도 거대 인공지능을 쌩쌩하게 쓰는 시대

실제 테스트 결과 엔비디아의 최신 가속기에서 연산 속도가 최대 8배까지 빨라졌습니다. 이는 기업들의 인공지능 서비스 비용을 크게 낮춰줄 것으로 보입니다. 효율성이 높아지면 서비스 단가가 낮아져 더 많은 사람이 인공지능을 이용하게 됩니다. 구글의 제미나이 고도화는 물론 다양한 온디바이스 환경에서 표준 기술이 될 전망입니다.