환영해🦉
기술/연구

“GPT-5도 30%는 포기?” 전 세계 47개국 수학 문제 담은 ‘매스넷’

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.28 08:46
“GPT-5도 30%는 포기?” 전 세계 47개국 수학 문제 담은 ‘매스넷’

기사 3줄 요약

  • 1 MIT 연구팀 세계 최대 규모 수학 데이터셋 매스넷 공개
  • 2 전 세계 47개국 올림피아드급 3만 개 문제 무료 개방
  • 3 GPT-5 정답률 69%에 그쳐 AI 추론 한계 명확히 노출
인공지능의 지능을 평가하는 가장 강력한 기준인 수학 추론 능력을 시험할 역대급 데이터셋이 공개되었습니다. 인공지능이 복잡한 논리를 풀어나가는 과정을 정밀하게 측정하기 위한 대규모 프로젝트가 결실을 맺었습니다. 매사추세츠 공과대학교(MIT) 연구진에 따르면 사우디아라비아의 킹 압둘라 과학기술대학교(KAUST)와 함께 3만 개 이상의 수학 문제와 해설을 담은 매스넷을 오픈소스로 선보였습니다. 전 세계 47개국에서 수집한 전문가들의 수학 올림피아드 문제를 체계적으로 정리하여 인공지능 연구 효율을 높일 전망입니다.

인공지능은 수학 천재가 아니다

매스넷은 지금까지 만들어진 증명 기반 수학 자료 중 가장 거대한 규모와 독보적인 품질을 자랑합니다. 17개 언어로 작성된 143개 경시대회의 문제를 포함하고 있으며 이는 기존에 존재하던 비슷한 자료보다 5배 이상 큰 수치입니다. 루마니아의 조합론이나 브라질의 정수론처럼 각 국가 수학계의 독특한 사고방식이 고스란히 담겨 있습니다. 연구진은 수십 년 전의 스캔본과 수천 페이지의 PDF 자료를 일일이 추적하여 디지털 데이터로 변환하는 정성을 쏟았습니다.

최강 모델도 3문제 중 1문제는 실패

연구진이 공개한 성능 테스트 결과는 기존 인공지능의 한계를 명확하게 보여줍니다. 현재 가장 뛰어난 성능을 가졌다고 알려진 GPT-5조차 매스넷의 핵심 문제들 중 약 69%의 정답만 맞히는 데 그쳤습니다. 특히 문제에 그림이나 도표가 포함된 경우에는 모든 모델의 정답률이 바닥으로 떨어지는 현상이 나타났습니다. 이는 인공지능이 시각적인 정보를 활용해 논리적으로 추론하는 능력이 여전히 부족하다는 사실을 증명합니다.

전 세계 학생들을 위한 선물

매스넷은 인공지능의 성능 개선을 넘어 교육 환경이 열악한 전 세계 학생들에게도 큰 희망이 될 것입니다. 누구나 인터넷을 통해 최고 수준의 올림피아드 문제와 공식 해설을 무료로 이용할 수 있기 때문입니다. 샤덴 알샤마리 MIT 연구원은 이번 프로젝트가 교육 인프라가 부족한 국가의 학생들에게 평등한 기회를 제공하기를 바란다고 강조했습니다. 이 방대한 자료는 깃허브와 허깅페이스를 통해 전 세계에 공개되어 누구나 자유롭게 활용할 수 있습니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 수학 올림피아드 문제 다 풀면 수학자 일자리 사라질까?

댓글 0