기술/연구

“메모리 6배 아낀다” 구글 터보퀀트 제미나이 속도 8배 향상

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.13 14:49

기사 3줄 요약

1 구글-카이스트 팀 AI 메모리 6배 압축 기술 공개
2 정확도 유지하며 제미나이 연산 속도 8배 향상
3 메모리 벽 해결로 인공지능 서비스 비용 절감 기대

구글 리서치가 인공지능의 고질적인 문제인 메모리 부족 현상을 해결할 신기술 터보퀀트를 발표했습니다. 이번 연구에는 카이스트 한인수 교수팀이 공동으로 참여해 세계적인 주목을 받고 있습니다. 터보퀀트는 인공지능이 데이터를 처리할 때 사용하는 메모리 공간을 획기적으로 줄여주는 기술입니다. 이를 통해 대형언어모델의 연산 효율을 극대화하는 성과를 거두었습니다.

인공지능의 기억 장치인 KV 캐시의 혁명

인공지능이 긴 문장을 이해하려면 디지털 요약장인 KV 캐시라는 메모리 공간이 반드시 필요합니다. 그러나 데이터가 쌓일수록 시스템이 느려지는 메모리 벽 현상이 큰 걸림돌이 되었습니다. 터보퀀트는 이 요약장 공간을 기존보다 6배 이상 압축하면서도 인공지능의 정확도를 완벽하게 유지합니다. 별도의 추가 학습 과정 없이 즉시 적용할 수 있다는 점이 가장 큰 강점입니다.

수학적 설계로 연산 속도 8배 향상

핵심 원리는 데이터를 방향과 거리만으로 저장하는 폴라퀀트와 미세 오차를 잡는 QJL 기술의 결합입니다. 카이스트 연구진은 1비트 정보만으로 오차를 보정하는 정교한 알고리즘 설계를 주도했습니다. 실험 결과에 따르면 터보퀀트를 적용한 모델은 이전보다 연산 속도가 최대 8배까지 빨라졌습니다. 이는 인공지능 서비스의 비용을 낮추고 처리량을 늘리는 데 직접적인 도움을 줍니다.

성능 왜곡 논란과 향후 전망

다만 일각에서는 기존 연구인 RaBitQ와의 비교 실험이 불공정했다는 비판도 제기되고 있습니다. 성능 차이를 부각하는 과정에서 하드웨어 조건을 다르게 설정했다는 지적이 나온 상태입니다. 이번 연구 성과는 오는 4월 브라질에서 열리는 국제 학술대회에서 공식적으로 발표될 예정입니다. 터보퀀트는 향후 온디바이스 AI와 검색 시장에서 핵심적인 표준 기술이 될 전망입니다.