환영해🦉
기술/연구

“수학 3개 중 1개 틀려?” GPT-5도 쩔쩔맨 ‘매스넷’

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.05.01 10:14
“수학 3개 중 1개 틀려?” GPT-5도 쩔쩔맨 ‘매스넷’

기사 3줄 요약

  • 1 MIT, 세계 최대 수학 데이터셋 매스넷 전격 공개
  • 2 GPT-5 정답률 69% 기록하며 AI 수학 한계 노출
  • 3 47개국 문제 무료 개방으로 지식 공유 가치 실현
인공지능의 수학 실력을 정확하게 확인할 수 있는 도구가 나왔습니다. 매사추세츠 공과대학교 연구진이 세계 최대 규모의 수학 데이터셋을 공개하며 화제를 모으고 있습니다. 이번 프로젝트에는 사우디아라비아의 연구진과 기술 기업도 함께 참여했습니다. 최첨단 인공지능이 복잡한 논리 문제를 얼마나 잘 푸는지 시험하는 것이 주요 목표입니다.

역대급 수학 문제집이 나타났다

매스넷은 지금까지 만들어진 수학 데이터셋 중 가장 큰 규모를 자랑합니다. 전 세계 47개국에서 출제된 3만 개 이상의 올림피아드 문제가 담겨 있습니다. 기존 자료보다 규모가 5배나 크고 해설의 품질도 매우 높습니다. 미국뿐만 아니라 브라질이나 루마니아 등 여러 국가의 독특한 수학 문제들을 모두 모았습니다. 연구진은 수천 권의 문제집과 수십 년 된 스캔본을 일일이 찾아냈습니다. 이 과정에서 수작업으로 자료를 모아온 개인 전문가의 도움도 컸다고 알려졌습니다.

똑똑하다던 인공지능도 쩔쩔매네

연구진이 최신 인공지능인 GPT-5를 대상으로 직접 테스트를 진행했습니다. 하지만 인공지능의 정답률은 약 69% 수준으로 기대보다 낮게 나타났습니다. 수학 올림피아드 문제 3개 중 1개는 여전히 풀지 못하는 셈입니다. 특히 그림이나 도표가 포함된 기하학 문제에서 인공지능은 큰 약점을 보였습니다. 비주류 언어로 된 문제의 경우 정답률이 0%를 기록하는 결과도 있었습니다. 이는 인공지능 학습이 특정 언어에만 쏠려 있다는 사실을 명확히 입증합니다.

전 세계 학생들에게 열린 기회

이번에 공개된 매스넷은 누구나 무료로 사용할 수 있는 오픈소스 형태입니다. 교육 환경이 어려운 지역의 학생들도 최고 수준의 문제를 접할 수 있게 되었습니다. 인공지능 연구자들은 이 데이터를 통해 모델의 추론 능력을 개선할 수 있습니다. 지식의 격차를 해소하고 공평한 교육 환경을 만드는 데 기여할 전망입니다. 현재 이 데이터셋은 깃허브와 허깅페이스를 통해 전 세계에 공유되고 있습니다. 앞으로 인공지능이 인간의 수학적 사고를 어디까지 따라올지 많은 기대가 모입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 수학 올림피아드 문제를 못 푸는 건 당연하다

댓글 0

관련 기사