환영해🦉
기술/연구

“사람 도움 필요 없다” 메타, 검색하며 혼자 크는 AI 공개

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.01.19 18:38
“사람 도움 필요 없다” 메타, 검색하며 혼자 크는 AI 공개

기사 3줄 요약

  • 1 메타, 스스로 진화하는 AI '닥터 제로' 공개
  • 2 검색 엔진 활용해 문제 만들고 해결 능력 키워
  • 3 사람 데이터 없이 기존 AI 성능 뛰어넘어
상상해 보세요. 선생님도 없고 교과서도 없는데, 인터넷 검색만으로 혼자 공부해서 전교 1등을 하는 학생이 있다면 어떨까요? 메타가 바로 그런 인공지능(AI)을 세상에 내놓았습니다. 사람의 도움이나 데이터 없이도 스스로 문제를 만들고 풀며 똑똑해지는 AI, 이름하여 ‘닥터 제로(Dr. Zero)’가 그 주인공입니다. 지금까지 AI를 가르치기 위해 수많은 사람이 데이터를 입력하고 정답을 알려줘야 했던 ‘노가다’의 시대가 끝날 수도 있다는 신호탄입니다.

스스로 문제 내고 푸는 ‘자습왕’ AI

메타 슈퍼인텔리전스 랩스(MSL)가 발표한 보고서에 따르면, 닥터 제로는 외부 검색 엔진 하나만 있으면 알아서 성장합니다. 이 시스템은 마치 두 명의 학생이 서로를 가르치는 것과 비슷하게 작동합니다. 하나는 문제를 내는 ‘제안자’이고, 다른 하나는 문제를 푸는 ‘해결자’입니다. 제안자가 검색 엔진을 뒤져서 까다로운 문제를 만들어 내면, 해결자는 그 문제를 풀면서 실력을 키웁니다. 처음에는 쉬운 문제로 시작하지만, 해결자의 실력이 늘면 제안자는 점점 더 어려운 문제를 냅니다. 재미있는 점은 보상 방식입니다. 제안자가 너무 쉬운 문제를 내서 해결자가 다 맞히거나, 반대로 너무 터무니없는 문제를 내서 다 틀리면 점수를 적게 받습니다. 딱 ‘도전해 볼 만한’ 수준의 문제를 냈을 때 최고의 점수를 받죠. 덕분에 사람 선생님이 없어도 AI끼리 최적의 학습 난이도를 조절하며 무한히 성장하는 시스템이 완성되었습니다.

비싼 수업료는 이제 그만

그동안 이런 방식이 없었던 건 아닙니다. 하지만 AI가 혼자 공부하게 하려면 엄청난 계산 비용, 즉 ‘돈’이 많이 들었습니다. 기존 방식은 문제 하나에 대해 수많은 답을 만들어 비교해야 했기 때문입니다. 하지만 닥터 제로는 ‘HRPO’라는 새로운 기술을 도입해 이 문제를 해결했습니다. 어려운 전문 용어 같지만, 쉽게 말해 문제의 복잡도에 따라 비슷한 것끼리 묶어서 효율적으로 채점하는 방식입니다. 덕분에 계산 비용은 줄이면서도 학습 효과는 오히려 더 좋아졌습니다. 메타는 이 기술을 통해 효율성과 성능이라는 두 마리 토끼를 모두 잡았다고 설명했습니다.

사람한테 배운 AI보다 더 똑똑하다?

결과는 놀라웠습니다. 닥터 제로는 사람이 일일이 정답을 알려주며 가르친 기존의 AI 모델들과 대결했을 때, 대등하거나 오히려 더 뛰어난 성적을 거뒀습니다. 특히 복잡한 정보를 찾아야 하는 퀴즈 대결(2WikiMQA 벤치마크)에서는 기존 방식보다 성능이 14% 이상 향상되었습니다. 사람이 정성 들여 만든 데이터 없이, AI가 스스로 인터넷을 검색하며 깨우친 지식만으로 이런 성과를 낸 것입니다. 연구진에 따르면, 앞으로 질 좋은 학습 데이터를 구하기가 점점 어려워질 것이라고 합니다. 하지만 닥터 제로처럼 데이터 없이 스스로 진화하는 AI가 나온다면, 데이터 부족 문제는 더 이상 장애물이 되지 않을 것입니다. 이제 AI는 인간의 가르침을 넘어, 스스로 지식의 탑을 쌓아 올리는 단계로 진입하고 있습니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 사람 도움 없이 스스로 학습하는 것, 찬성?

댓글 0