기술/연구

"메모리 6배나 아낀다" 구글이 공개한 터보퀀트의 정체

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.01 07:40

기사 3줄 요약

1 구글, 인공지능 메모리 6배 압축 기술 공개
2 카이스트 한인수 교수 참여해 성능 8배 향상
3 별도 학습 없이 즉시 적용 가능한 압축 표준

구글 리서치와 딥마인드 그리고 카이스트 한인수 교수 공동 연구팀에 따르면 새로운 알고리즘인 터보퀀트가 공개되었습니다. 이 기술은 대형언어모델의 고질적인 문제인 메모리 과부하를 수학적으로 해결했습니다. 인공지능이 문맥을 기억하는 공간을 성능 저하 없이 6배 이상 압축하는 성과를 냈습니다.

인공지능 메모리 병목 현상 왜 생길까

인공지능 모델이 정교해질수록 기억해야 할 정보가 너무 많아집니다. 특히 긴 문장을 처리할 때 사용하는 케이브이 캐시는 엄청난 메모리를 점유합니다. 데이터가 쌓일수록 시스템 속도가 느려지는 주범이 되기도 합니다. 공동 연구팀의 발표에 따르면 기존 기술은 데이터를 압축할 때 추가 정보를 따로 저장해야 했습니다. 이 때문에 실제 압축 효율이 떨어지고 정밀도가 손실되는 한계가 있었습니다. 터보퀀트는 이러한 숨은 비용을 수학적으로 완전히 제거하며 데이터 구조를 재설계했습니다.

극좌표 변환으로 데이터 구조를 다시 짜다

터보퀀트는 데이터를 바라보는 좌표계 자체를 바꾸는 혁신을 보여주었습니다. 폴라퀀트라는 기술을 사용하여 데이터를 거리와 방향이라는 극좌표계로 변환합니다. 이는 고차원 데이터가 특정한 구 형태의 패턴을 가진다는 점을 활용한 방식입니다. 여기에 큐제이엘이라는 기법이 결합되면서 기술의 완성도가 더욱 높아졌습니다. 카이스트 한인수 교수가 주도한 이 알고리즘은 단 1비트의 정보만으로 미세한 오차를 잡아냅니다. 초저비트 환경에서도 원본 모델과 동일한 수준의 정확도를 유지하는 핵심 역할을 합니다.

엔비디아 성능 8배 끌어올린 압도적 결과

공동 연구팀의 벤치마크 결과에 따르면 엔비디아 에이치백 환경에서 연산 속도가 최대 8배 빨라졌습니다. 메모리 사용량은 기존 대비 6분의 1 수준으로 획기적으로 줄어들었습니다. 그러면서도 인공지능이 내놓는 답변의 정확도는 원본과 거의 차이가 없었습니다. 이 기술은 별도의 추가 학습이 필요 없어 기존 모델에 즉시 적용할 수 있습니다. 수십억 개의 데이터를 검색할 때도 기존 방식보다 더 높은 정확도를 기록했습니다. 인공지능 인프라의 효율을 극대화할 강력한 게임 체인저로 평가받는 이유입니다.

인공지능 대중화 앞당길 표준 기술 될까

터보퀀트는 구글의 생성형 인공지능 서비스인 제미나이 고도화에 핵심적으로 쓰일 예정입니다. 스마트폰이나 노트북 같은 기기에서 작동하는 온디바이스 인공지능 환경에서도 큰 활약이 기대됩니다. 인공지능 서비스의 운영 비용을 낮춰 기술의 보편화를 앞당길 전망입니다. 연구팀은 이번 성과를 다가오는 세계적인 인공지능 학회인 아이씨엘알에서 발표할 계획입니다. 한국 학계의 역량이 글로벌 빅테크 기업의 핵심 알고리즘 설계에 직접 기여했다는 점도 매우 뜻깊습니다. 인공지능 압축 기술의 새로운 글로벌 표준이 될지 전 세계가 주목하고 있습니다.