환영해🦉
기술/연구

AI 포켓몬 마스터? 앤트로픽 '클로드'의 충격적 게임 실력에 연구진 당황

댓글 0 · 저장 0 2025.04.11 05:38
AI 포켓몬 마스터? 앤트로픽 '클로드'의 충격적 게임 실력에 연구진 당황

기사 3줄 요약

  • 1 앤트로픽의 AI '클로드', 포켓몬 레드 게임 실험 중
  • 2 클로드 3.7 버전, 시각적 한계에도 체육관 리더 3명 격파
  • 3 AI 장기 계획 능력 테스트 위한 벤치마크 역할 수행

어린이 게임도 못하는 AI, 그래도 괜찮아요

영화 '엑스맨'에서 천재적인 능력을 가진 돌연변이들이 등장하듯, 요즘 AI도 놀라운 능력을 보여주고 있습니다. 하지만 앤트로픽의 AI '클로드'가 1996년 출시된 '포켓몬 레드' 게임을 플레이하는 모습을 보면, AI도 아직은 완벽하지 않다는 것을 알 수 있습니다. 이 프로젝트는 데이비드 허시(David Hershey)가 주도한 앤트로픽의 내부 실험으로 시작됐습니다. 목표는 간단합니다. AI가 어린이용 게임을 얼마나 잘 플레이할 수 있는지 테스트하는 것이죠. 특히 이 실험은 AI의 장기적 계획 능력을 스트레스 테스트하기 위한 목적이었습니다. 허시는 "이 프로젝트는 앤트로픽 내부에서 2024년 초에 시작됐어요. 클로드 3.5 소넷 모델을 사용해 포켓몬 레드를 플레이하게 했죠"라고 설명했습니다. 현재는 업그레이드된 클로드 3.7 소넷을 사용해 실험을 진행 중입니다.

클로드의 '시력'이 문제

클로드가 게임에서 겪는 가장 큰 문제는 '시력'입니다. AI는 게임 화면을 정확히 해석하는 데 어려움을 겪고 있습니다. 이로 인해 공간 인식과 중요 객체 식별에 어려움이 있어 게임 내 이동과 의사결정에 문제가 생깁니다. 허시는 "클로드의 학습 데이터에는 '게임보이 화면처럼 보이는 것'에 대한 자세한 텍스트 설명이 많지 않았을 겁니다"라고 추측했습니다. 이러한 시각적 한계로 인해 클로드는 종종 벽에 부딪히거나, 스토리를 진행하기 위해 NPC(게임 내 캐릭터)와 대화해야 할 때를 인식하지 못해 게임에서 막히는 경우가 많습니다.

클로드 3.7의 발전

그럼에도 불구하고, 클로드 3.7 소넷은 이전 버전보다 확실한 발전을 보여주고 있습니다. 이전 버전인 클로드 3.5는 포켓몬 배틀에서 도망치는 경향이 있었지만, 3.7 버전은 게임을 더 깊이 진행하며 이미 3명의 체육관 리더를 격파했습니다. 클로드 3.7 소넷의 '확장된 사고'는 이전 모델이 하지 못했던 방식으로 '미리 계획하고, 목표를 기억하며, 초기 전략이 실패할 때 적응'하는 능력을 보여줍니다. 이 모델은 퍼즐을 '생각'하고 포켓몬 배틀에서 승리하는 방법을 효과적으로 터득했습니다.

기발한 문제 해결 능력

클로드는 제한된 상황에서도 때때로 창의적인 문제 해결 능력을 보여줍니다. 예를 들어, 게임의 세 번째 실행 중에 클로드가 개발한 독특한 해결책 중 하나는 마운트 문(Mt. Moon)에서 탈출하기 위해 의도적으로 모든 포켓몬을 기절시키는 전략이었습니다. 또한 나무 줄에 막혔을 때, 클로드는 포켓몬이 기절한 상태에서도 'CUT' 명령을 사용할 수 있다는 NPC의 말을 듣고 이를 활용했습니다. 이는 클로드가 게임 내 경험을 바탕으로 시간이 지남에 따라 전략을 개선하는 적응형 의사결정을 보여주는 좋은 예입니다.

프로젝트의 의미

'클로드 플레이즈 포켓몬(ClaudePlaysPokemon)'이라는 이름의 이 프로젝트는 트위치(Twitch)에서 실시간으로 스트리밍되고 있습니다. 이 프로젝트는 게임플레이를 통해 AI 시스템을 평가하는 벤치마크 역할을 하며, 대규모 언어 모델(LLM)이 인간처럼 포켓몬 레드를 플레이할 수 있는지 도전합니다. 이 프로젝트는 포켓몬에 대해 특별히 훈련받지 않은 AI 모델이 일반적인 사고를 어떻게 활용할 수 있는지 추적합니다. 체육관 배지 획득 수와 게임 세계를 탐색하는 능력 등이 평가 지표로 사용됩니다. 허시는 "이것은 순전히 [클로드]가 세상에 대해 이해하는 다양한 것들을 비디오 게임에 적용하는 것입니다"라고 설명했습니다.

제미나이 프로젝트

'클로드 플레이즈 포켓몬'에 영감을 받아, 제미나이 프로젝트도 만들어졌습니다. 이 프로젝트는 포켓몬에 대해 훈련받지 않은 AI 모델이 일반적인 사고를 어떻게 활용할 수 있는지 알아보기 위한 것입니다. 제미나이 프로젝트 뒤에 있는 영감은 '클로드 플레이즈 포켓몬'이 이미 해봤고, 그것을 비슷하게 만드는 것이 재미있는 연습처럼 보였다는 것입니다. 결국, 클로드의 포켓몬 레드 게임 플레이는 현재 AI 모델의 능력과 한계에 대한 귀중한 통찰력을 제공합니다. 이 프로젝트는 AI가 얼마나 발전했는지, 그리고 아직 얼마나 더 발전해야 하는지를 보여줍니다.
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 게임 마스터 될 날 올까요?

댓글 0

관련 기사

최신 기사

사용자 피드백