“데이터 1/8만 썼는데…” 메타 AI, 인간 모방 뛰어넘는 법 찾았다
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.10.17 19:14

기사 3줄 요약
- 1 메타, 보상 없이 AI가 스스로 배우는 새 훈련법 공개
- 2 인간 모방 않고 자신의 행동 결과로 학습하는 방식
- 3 기존 대비 성공률 9.6% 향상, 데이터 효율성 입증
메타가 인공지능(AI)이 스스로 학습하는 새로운 길을 열었습니다.
최근 메타의 슈퍼인텔리전스 랩스(MSL)는 ‘초기 경험’이라는 새로운 AI 훈련 방식을 공개했습니다. 이는 인간의 가르침이나 ‘잘했다’는 보상 없이, AI가 스스로의 경험을 바탕으로 똑똑해지는 획기적인 기술입니다.
기존 AI는 주로 전문가의 행동을 그대로 따라 하는 ‘모방 학습’에 의존했습니다. 하지만 이 방식은 많은 양의 데이터가 필요하고, 새로운 상황에 대처하는 능력이 떨어지는 한계가 있었습니다.
그래서 초기 경험이 뭔데?
초기 경험은 이런 문제를 해결하기 위해 등장했습니다. AI가 사람의 행동을 무작정 따라 하는 대신, 특정 상황에서 스스로 다른 행동을 시도하고 그 결과를 데이터로 쌓는 방식입니다. 이는 마치 아이가 넘어지면서 걷는 법을 배우는 것과 같습니다. AI는 자신의 선택이 어떤 결과로 이어지는지 직접 겪으며 세상의 원리를 스스로 깨우치게 됩니다. 더 이상 인간이 하나부터 열까지 가르쳐줄 필요가 없는 셈입니다.스스로 예측하고 반성한다고?
초기 경험의 핵심은 두 가지 전략으로 나뉩니다. 첫 번째는 ‘암묵적 세계 모델링(IWM)’입니다. 이는 AI가 자신의 행동이 어떤 미래를 가져올지 미리 예측하는 능력입니다. 마치 체스 선수가 다음 수를 내다보는 것과 같습니다. 두 번째는 ‘자기 성찰(SR)’입니다. AI는 같은 상황에서 전문가의 행동과 자신의 행동을 비교 분석합니다. 왜 전문가의 선택이 더 나았는지 스스로 이유를 찾고, 다음번에는 더 나은 결정을 내리도록 정책을 수정합니다. 말 그대로 AI가 스스로 ‘오답노트’를 쓰는 것입니다.그래서 성능은 얼마나 좋아졌는데?
결과는 놀라웠습니다. MSL의 논문에 따르면, 8개의 각기 다른 언어 AI 환경에서 테스트한 결과, 초기 경험으로 훈련한 AI는 기존 모방 학습보다 성공률이 평균 9.6% 더 높았습니다. 특히 데이터 효율성이 눈에 띕니다. 온라인 쇼핑 환경을 가정한 ‘웹숍’ 테스트에서는, 전체 데이터의 8분의 1만 사용하고도 기존 방식을 뛰어넘는 성과를 보였습니다. 적은 양의 데이터로 더 똑똑한 AI를 만들 수 있다는 사실을 증명한 것입니다.진짜 자율 AI 시대가 오는 걸까?
연구진은 초기 경험이 모방 학습과 완벽한 경험 기반 AI 사이의 중요한 다리가 될 것이라고 강조했습니다. 인간의 개입을 최소화하고 AI가 스스로 발전하는 진정한 의미의 ‘자율 AI’ 시대로 가는 중요한 첫걸음이라는 평가입니다. 이 기술은 AI가 단순한 도구를 넘어 인류의 지적 파트너로 성장할 가능성을 보여줍니다. 스스로 생각하고 배우는 AI가 앞으로 우리 사회를 어떻게 바꿔나갈지 주목됩니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI가 스스로 배우는 기술, 축복일까 재앙일까?
축복
0%
0명이 투표했어요
재앙
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



