환영해🦉
기술/연구

“AI가 다 외운다고? 천만의 말씀!” 빅테크 연합, 기억 한계 첫 증명

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.06.06 04:26
“AI가 다 외운다고? 천만의 말씀!” 빅테크 연합, 기억 한계 첫 증명

기사 3줄 요약

  • 1 빅테크·대학 공동 연구, AI 기억 한계 밝혀
  • 2 AI, 학습 데이터 많을수록 개별 기억력 저하
  • 3 저작권 및 AI 안전 논쟁 새 전기 마련 기대
최근 인공지능(AI)이 마치 모든 것을 기억하고 베끼는 것처럼 여겨지곤 했습니다. 하지만 세계적인 IT 기업인 메타, 구글, 엔비디아와 코넬 대학교 연구팀이 이 통념을 뒤집는 연구 결과를 발표했습니다. 이들은 AI가 실제로 정보를 얼마나 기억하는지에 대한 중요한 단서를 찾아냈습니다.

AI, 진짜 아무거나 다 외울까?

연구팀은 AI에게 일부러 무작위로 뒤섞인 의미 없는 데이터를 학습시키는 독특한 방법을 사용했습니다. AI가 이 데이터를 얼마나 잘 기억해내는지 살펴보니, 생각보다 기억 용량이 크지 않다는 점을 발견했습니다. AI의 기억 용량은 AI의 뇌세포 하나하나에 해당하는 매개변수(파라미터) 1개당 약 3.6비트(정보의 최소 단위) 정도였습니다. 이는 영어 알파벳 한 글자를 저장하기에도 빠듯한 아주 작은 용량입니다. 연구팀이 밝혀낸 다른 주요 내용은 다음과 같습니다.
주요 발견쉽게 말하면?
기억 용량의 한계AI 뇌세포(매개변수) 1개당 약 3.6비트만 기억
독특한 연구 방식의미 없는 무작위 데이터로 AI 훈련시켜 순수 기억력 측정
학습 데이터가 많을수록?방대한 데이터를 배우면 개별 정보는 오히려 덜 기억함
개인 정보 유추 공격학습 데이터가 많을수록 특정 정보 유추하기 어려워짐
AI가 잘 외우는 것수학 공식, 프로그래밍 코드처럼 구조화된 정보
이처럼 AI는 우리가 생각하는 것만큼 모든 것을 그대로 외우지는 않습니다.

데이터가 많을수록 똑똑해질까?

더 흥미로운 사실은 AI에게 더 많은 데이터를 학습시킬수록, 특정 정보 하나하나를 기억할 가능성은 오히려 줄어든다는 점입니다. 마치 한정된 용량의 저장 공간에 너무 많은 파일을 넣으면, 각 파일에 대한 세부 정보는 희미해지는 것과 비슷합니다. 이는 개인 정보가 포함된 데이터가 학습에 사용되었는지 알아내려는 시도를 더 어렵게 만들어, 개인 정보 보호에 긍정적인 영향을 줄 수 있습니다.

그래서 우리에게 뭐가 좋은데?

이번 연구 결과는 여러 면에서 중요한 의미를 가집니다. AI가 단순히 원본 데이터를 통째로 외우는 것이 아니라는 점은 현재 뜨거운 AI 저작권 논쟁에 새로운 관점을 제공할 수 있습니다. 또한, AI가 어떻게 정보를 처리하고 일반화하는지 더 잘 이해하게 되어, 더 안전하고 믿을 수 있는 AI를 만드는 데 도움이 될 것입니다.

AI 기억력의 비밀, 앞으로가 더 중요해

물론 특정 형식의 데이터나 독특한 스타일의 글은 여전히 AI가 더 잘 기억하는 경향이 있을 수 있습니다. 하지만 이번 연구는 AI의 작동 방식을 이해하는 데 중요한 첫걸음을 떼었다고 평가받습니다. 앞으로 AI 기술이 발전함에 따라, 이러한 연구는 더욱 중요해질 것입니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI의 제한된 기억력, 저작권 논란 해결될까?

댓글 0

관련 기사