환영해🦉
기술/연구

성능 40% 껑충… 오픈소스로 풀린 '생각하는 AI' 비법

댓글 0 · 저장 0 2025.04.24 23:57
성능 40% 껑충… 오픈소스로 풀린 '생각하는 AI' 비법

기사 3줄 요약

  • 1 새 AI 훈련법 RAGEN, 생각하는 AI 목표
  • 2 LLM으로 가짜 데이터 생성, 강화학습 활용
  • 3 성능 40% 향상, 오픈소스로 기술 공개
AI가 단순히 시키는 일만 하는 것을 넘어, 스스로 생각하고 배우는 시대가 점점 다가오고 있습니다. 최근 공개된 'RAGEN'이라는 새로운 AI 훈련 방식이 바로 그 가능성을 보여주며 큰 주목을 받고 있습니다. 이 기술 덕분에 AI 성능이 무려 40%나 향상되었다고 합니다.

AI, 이제 진짜 '생각'한다고?

기존 AI는 사람이 만든 방대한 데이터를 보고 배우는 방식으로 똑똑해졌습니다. 하지만 사람이 만든 데이터에는 한계가 있고, 때로는 편견이 섞여 들어갈 수도 있습니다. 또, 세상의 모든 상황에 대한 데이터를 사람이 다 만들어 줄 수도 없습니다. 그래서 연구자들은 AI가 스스로 경험하고 배우는 방법을 고민해왔습니다. 마치 우리가 새로운 게임을 할 때, 처음에는 서툴지만 계속 플레이하면서 스스로 공략법을 터득하는 것처럼 말입니다. RAGEN은 바로 이런 아이디어에서 출발했습니다.

RAGEN, 어떻게 AI를 똑똑하게 만들까?

RAGEN의 핵심 아이디어는 '가짜 데이터'와 '스스로 학습'입니다. 우선, 이미 똑똑한 AI(거대 언어 모델, LLM)를 이용해서 AI가 풀어야 할 문제 상황과 같은 '가짜 연습 문제'(합성 데이터)를 대량으로 만들어냅니다. 마치 선생님 없이도 혼자 공부할 수 있도록 문제집을 잔뜩 만드는 것과 비슷합니다. 그 다음, AI 에이전트(문제를 푸는 주인공 AI)가 이 가짜 문제들을 풀게 합니다. 문제를 잘 풀면 '점수'(보상)를 주고, 못 풀면 점수를 깎는 방식으로 AI 스스로 점점 더 잘하는 방법을 찾아가도록 유도합니다. 이 과정을 '강화학습'이라고 부르는데, RAGEN은 'StarPO'라는 특별한 강화학습 방식을 사용해서 AI가 단순히 답만 맞추는 게 아니라, 문제 해결 과정까지 '생각'하도록 훈련시킵니다.

얼마나 똑똑해졌는데? 성능 보니…

결과는 놀라웠습니다. RAGEN으로 훈련받은 AI는 여러 어려운 시험(벤치마크)에서 눈부신 성적을 거뒀습니다. 예를 들어, AIME 2024라는 수학 문제 해결 능력 평가에서는 정확도가 40%나 급등했습니다. 코딩 능력을 평가하는 LiveCodeBench에서도 8% 이상 점수가 올랐고, 다른 수학 시험들에서도 최고 수준의 정확도를 기록했습니다. 이는 기존의 유명 AI 모델들과 비슷하거나 오히려 더 뛰어난 성능을 보이면서도, 훈련에 필요한 컴퓨터 자원은 덜 사용했다는 점에서 더욱 의미가 큽니다. 인간이 만든 데이터에 덜 의존하면서도 더 똑똑하고 효율적인 AI를 만들 수 있다는 가능성을 보여준 것입니다.

오픈소스로 풀린 비법, 왜?

더 놀라운 점은 이 RAGEN 기술이 '오픈소스'로 공개되었다는 것입니다. 즉, 누구나 이 기술의 원리를 들여다보고, 가져다 쓰고, 심지어 더 발전시킬 수도 있게 되었습니다. 연구팀은 더 많은 사람이 이 기술을 활용하여 AI 발전에 기여하도록 문을 활짝 연 것입니다. 이 연구에는 'DeepSeeker'라는 AI 모델 개발로 유명했던 곳의 연구원들도 참여했습니다. 그들의 경험과 노하우가 RAGEN이라는 혁신적인 기술 탄생에 밑거름이 되었습니다. 이제 RAGEN은 전 세계 개발자들의 손을 거쳐 더욱 강력하고 신뢰할 수 있는 AI로 발전할 것으로 기대됩니다.
구분 RAGEN 방식 기존 방식
데이터 생성 AI(LLM)가 자동으로 만듦 사람이 직접 만듦
확장성 매우 높음 사람 노력에 따라 제한적
비용 자동화로 상대적 저렴 수작업으로 상대적 비쌈
성능 벤치마크에서 향상됨 다양함
사람 데이터 의존도 낮음 높음

완벽하진 않아, 숙제는 없을까?

물론 RAGEN도 아직 풀어야 할 숙제는 있습니다. 가짜 데이터를 만드는 데 여전히 많은 컴퓨터 계산 능력이 필요하고, AI가 만드는 가짜 데이터에 혹시 편견이 섞여 들어가지는 않을지 계속 주의 깊게 살펴봐야 합니다. 또한, 가짜 문제 상황에서 배운 것이 실제 세상의 복잡한 문제에도 잘 통할지는 더 검증이 필요합니다. AI가 점점 더 똑똑해지는 만큼, 이 기술이 좋은 일에만 쓰이도록 윤리적인 고민도 함께 해야 합니다. RAGEN은 AI가 사람의 지시를 더 잘 따르고 위험한 행동을 피하도록 돕지만, 기술 자체의 오용 가능성이나 예상치 못한 부작용에 대해서도 늘 대비해야 합니다. 결국 RAGEN은 AI 기술의 중요한 발걸음이지만, 이것이 끝은 아닙니다. 기술 발전과 함께 윤리적 책임감을 가지고 AI를 올바른 방향으로 이끌어가는 노력이 계속되어야 할 것입니다.
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 스스로 생각하는 시대, 축복일까 재앙일까?

댓글 0

최신 기사

사용자 피드백