기술/연구

인간 수학자 긴장해! 89% 정확도 ‘수학 천재’ AI 등장

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.05.01 17:51

기사 3줄 요약

1 딥시크, 수학 증명 전문 AI ‘프로버-V2’ 조용히 공개
2 미니F2F 벤치마크서 88.9% 통과율, 성능 입증
3 홍보 대신 성능으로 승부, AI 수학 경쟁 새 국면

모두가 챗GPT 같은 대화형 AI에 주목할 때, 조용히 수학계를 뒤흔들 AI가 등장했습니다. 마치 비밀 병기처럼 공개된 이 AI는 복잡한 수학 문제를 풀고 증명하는 데 특화되어 있어, 앞으로 수학 연구나 교육에 큰 변화를 가져올지도 모릅니다. 지난 4월 30일, 딥시크(DeepSeek)라는 AI 회사가 '프로버-V2(Prover-V2)'라는 새로운 AI 모델을 조용히 공개했습니다. 보통 새로운 AI 모델이 나오면 대대적인 발표회를 열지만, 딥시크는 별다른 홍보 없이 커뮤니티 사이트에 모델을 올리는 방식을 택했습니다. 이는 알리바바 같은 경쟁사의 견제를 피하고, 오직 성능만으로 AI의 가치를 평가받겠다는 자신감의 표현으로 보입니다.

조용히 등장한 수학 천재 AI?

프로버-V2는 딥시크의 최신 AI 기술인 '딥시크-V3'를 기반으로 만들어졌습니다. 특히 6710억 개라는 어마어마한 규모의 매개변수(파라미터)를 가졌지만, '전문가 혼합(MoE)' 방식을 사용해 실제로 계산할 때는 일부 전문가(AI 모듈)만 선택적으로 활용합니다. 덕분에 엄청난 성능을 유지하면서도 컴퓨터 자원 소모는 줄이는 효율성을 잡았습니다. 이 모델은 2024년 8월에 나왔던 프로버-V1.5의 후속 버전으로, 딥시크가 꾸준히 AI의 수학적 추론 능력 향상에 힘쓰고 있음을 보여줍니다. 딥시크는 앞으로 공개할 차세대 추론 모델 '딥시크-R2'의 성능을 미리 엿볼 수 있는 연구 결과들도 계속 발표하고 있습니다.

그래서 뭘 할 수 있는데?

프로버-V2는 단순히 답만 찾는 것을 넘어, 고등학교나 대학교 수준의 수학 문제를 단계별로 증명하는 과정을 생성할 수 있습니다. 복잡한 수학적 주장에서 논리적 오류를 100% 확실하게 찾아내는 능력도 갖췄습니다. 마치 수학 선생님처럼, 어려운 증명 과정을 '린 4(Lean 4)'라는 수학 증명용 특수 언어 코드와 함께 자연스러운 설명으로 풀어서 보여주기도 합니다. 이를 위해 AI는 복잡한 정리를 여러 개의 작은 목표로 나눕니다. 그리고 이 목표들을 린 4 코드로 변환한 뒤, 여러 전문가 AI가 협력하는 방식으로 처리합니다. 최대 16만 개가 넘는 단어(토큰)를 한 번에 처리할 수 있어 아주 긴 증명 과정에서도 논리적 흐름을 놓치지 않습니다.

얼마나 대단한 거야?

이 AI의 실력은 이미 여러 수학 문제 해결 능력 평가에서 입증되었습니다. '미니F2F(MiniF2F-test)'라는 표준 시험에서는 88.9%의 통과율을 기록했고, 매우 어려운 대학생 수준의 수학 경시대회 문제인 '퍼트넘벤치(PutnamBench)'에서도 658개 문제 중 49개를 풀어내는 성과를 보였습니다. 딥시크는 자신들이 만든 '프로버벤치(ProverBench)'라는 새로운 평가에서도 뛰어난 성능을 보였다고 밝혔습니다. 자신들의 실력에 자신이 있기 때문에, 굳이 시끄럽게 홍보하지 않고 AI 커뮤니티가 직접 성능을 검증하도록 한 것입니다.

벤치마크	성능
미니F2F (MiniF2F)	88.9% 통과율
퍼트넘벤치 (PutnamBench)	658문제 중 49개 해결
프로버벤치 (ProverBench)	다양한 수학 영역에서 뛰어난 성능

장점만 있는 건 아니지?

물론 프로버-V2에도 한계는 있습니다. 워낙 강력한 AI이다 보니 일반 컴퓨터에서 실행하기에는 부담스러울 수 있습니다. 또한 '린 4'라는 특정 증명 보조 언어에 익숙하지 않으면 활용하기 어려울 수도 있습니다. 윤리적인 문제도 고려해야 합니다. 만약 이 AI가 잘못된 수학적 증명을 생성하거나 검증하는 데 악용된다면 큰 혼란을 일으킬 수 있습니다. 또한 수학 연구나 교육에서 AI에 너무 의존하게 되면 인간의 창의성이나 비판적 사고 능력이 약해질 수 있다는 우려도 나옵니다. 프로버-V2의 등장은 AI가 인간의 지적 영역, 특히 수학 분야에서 얼마나 강력한 도구가 될 수 있는지를 보여주는 중요한 사건입니다. 앞으로 AI가 수학 연구와 교육의 방식을 근본적으로 바꿀 수도 있겠습니다. 이제 AI를 어떻게 현명하게 활용할 것인지 고민해야 할 때입니다.

편집자: 이도윤 기자

제보·문의: aipick@aipick.kr