“AI 성능 64배 점프!” MIT가 찾아낸 AI의 결정적 약점과 해법
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.09.23 19:13

기사 3줄 요약
- 1 MIT, AI의 논리적 계획 능력 강화하는 새 기술 개발
- 2 AI가 스스로 오류 배우고 외부 검증받는 3단계 훈련법
- 3 어려운 테스트서 성능 64배 향상, 로봇 등 실용화 기대
세계 최고의 공과대학 MIT 연구진이 인공지능(AI)의 계획 수립 능력을 획기적으로 높이는 새로운 방법을 개발했습니다.
그동안 AI는 그럴듯하게 말은 잘했지만, 정작 여러 단계를 거쳐야 하는 복잡한 계획을 세울 때는 논리가 맞지 않는 엉뚱한 답을 내놓는 경우가 많았습니다. 이런 문제를 해결하기 위해 MIT가 ‘PDDL-인스트럭트’라는 특별한 AI 훈련법을 공개했습니다. 이 방법으로 훈련받은 AI는 단순히 말을 잘하는 수준을 넘어, 검증 가능한 완벽한 계획을 세울 수 있게 됐습니다.
AI는 왜 자꾸 헛소리를 할까?
AI 언어 모델은 방대한 데이터를 학습해 사람처럼 자연스러운 문장을 만들어냅니다. 하지만 실제 세상의 논리나 규칙을 완벽하게 이해하는 것은 아니어서, 겉보기엔 멀쩡하지만 실제로는 실행 불가능한 계획을 세우곤 합니다. 예를 들어 로봇에게 ‘방을 청소하라’고 명령하면, ‘진공청소기를 들고 바닥을 민다’는 식의 순서는 알지만 ‘청소기 코드를 먼저 꽂아야 한다’는 당연한 단계를 빠뜨릴 수 있습니다. MIT 연구진은 바로 이런 AI의 근본적인 한계를 극복하고자 했습니다.MIT의 3단계 특급 훈련법은 뭘까?
MIT가 개발한 ‘PDDL-인스트럭트’는 세 가지 특별한 단계로 AI를 훈련시킵니다. 마치 학생에게 ‘오답노트’를 쓰게 하고, ‘생각하는 과정’을 검사하며, ‘전문가’의 피드백을 주는 것과 같습니다. 첫 번째 ‘오류 학습’ 단계에서는 AI가 자신이 세운 계획이 왜 실패했는지 스스로 설명하게 합니다. 두 번째 ‘논리적 사고 사슬’ 단계에서는 계획의 모든 과정을 단계별로 차근차근 생각하고 기록하도록 만듭니다. 마지막 ‘외부 검증’ 단계에서는 ‘VAL’이라는 외부 검증 전문가가 AI의 계획을 꼼꼼히 확인합니다. 이때 단순히 ‘맞다/틀리다’만 알려주는 게 아니라, 어떤 부분이 왜 잘못됐는지 아주 상세한 피드백을 줍니다. 연구에 따르면 이 상세한 피드백이 AI의 성능을 크게 높이는 핵심 비결이었습니다.그래서 얼마나 똑똑해졌는데?
결과는 놀라웠습니다. 이 3단계 훈련을 거친 AI ‘라마-3-8B’ 모델의 계획 수립 능력을 테스트해 보니, 특정 문제에서 성공률이 94%에 달했습니다. 특히 변수가 많아 기존 AI들이 5% 미만의 성공률을 보이던 아주 어려운 ‘미스터리 블록 쌓기’ 문제에서는 성능이 무려 64배나 향상됐습니다. 이는 AI의 일반적인 추론 능력과 자동화 계획에 필요한 논리적 정확성 사이의 간극을 크게 줄였다는 점에서 의미가 큽니다. 이제 AI가 로봇 제어나 자율 주행처럼 복잡하고 정교한 실제 세상의 문제를 해결할 수 있는 가능성이 열린 셈입니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI의 논리력 향상, 인류에게 축복인가 재앙인가?
축복이다
0%
0명이 투표했어요
재앙이다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



