기술/연구

“성능은 그대로, 용량만 1/6?” 구글과 KAIST가 인공지능 한계 넘었다

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.25 12:52

기사 3줄 요약

1 구글과 KAIST가 인공지능 메모리 6배 압축 기술 개발
2 터보퀀트 도입으로 연산 속도 최대 8배 향상 성공
3 추가 학습 없이 다양한 모델에 즉시 적용 가능해 화제

인공지능 모델의 발목을 잡던 메모리 부족 문제가 마침내 해결될 조짐을 보입니다. 구글 리서치와 KAIST 한인수 교수 공동 연구팀이 혁신적인 압축 기술인 터보퀀트를 발표했습니다. 이번 기술은 챗GPT와 같은 대형언어모델이 정보를 기억하는 방식을 완전히 바꿨습니다. 기존보다 메모리를 6배나 적게 쓰면서도 인공지능의 똑똑함은 그대로 유지합니다.

인공지능의 기억력을 높이는 마법 같은 기술

인공지능은 긴 대화를 할 때 과거 내용을 기억하기 위해 엄청난 메모리를 사용합니다. 이를 KV 캐시라고 부르는데 데이터가 쌓일수록 시스템 속도가 느려지는 원인이 됩니다. 터보퀀트는 데이터를 저장하는 수학적 구조를 재설계하여 이 문제를 해결했습니다. 마치 복잡한 지도를 단순한 방향과 거리로 바꿔서 저장 공간을 획기적으로 줄인 것과 같습니다. 구체적으로는 폴라퀀트와 QJL이라는 두 가지 핵심 기술이 결합되어 작동합니다. 데이터를 가장 효율적인 형태로 재구성하고 미세한 오차까지 수학적으로 잡아내는 방식입니다.

성능은 8배 빨라지고 비용은 뚝 떨어진다

연구팀에 따르면 이번 기술을 적용했을 때 연산 속도가 기존보다 최대 8배나 빨라졌습니다. 실제 엔비디아의 최신 그래픽 장치인 H100 환경에서 압도적인 성능을 입증했습니다. 이 기술의 가장 큰 장점은 별도의 추가 학습 없이도 바로 적용이 가능하다는 점입니다. 제미나이와 같은 다양한 인공지능 서비스에 즉시 도입하여 효율을 높일 수 있습니다. 성능 저하 없이 용량을 줄이는 기술은 인공지능 서비스 비용을 낮추는 데 기여합니다. 결과적으로 더 많은 사람이 고성능 인공지능을 저렴하게 이용할 수 있게 됩니다.

스마트폰 속 인공지능 시대가 앞당겨진다

터보퀀트는 클라우드 서버뿐만 아니라 스마트폰 같은 개인 기기에서도 큰 힘을 발휘합니다. 기기 자체에서 인공지능을 돌리는 온디바이스 기술의 핵심 표준이 될 전망입니다. KAIST 한인수 교수는 이번 연구에서 오차를 보정하는 핵심 알고리즘 설계를 주도했습니다. 국내 연구진의 기술력이 글로벌 인공지능 인프라의 표준을 세웠다는 평가를 받습니다. 이번 연구 결과는 다가오는 4월 국제 학술대회인 국제표현학습학회에서 공식 발표됩니다. 인공지능 대중화를 이끌 기술적 전환점이 마련되면서 업계의 기대가 쏠리고 있습니다.