MS의 반격? 작은 AI가 GPT-4 추론 능력 앞질렀다
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.05.02 02:04

기사 3줄 요약
- 1 MS, 작지만 강한 AI 'Phi-4-Reasoning-Plus' 공개.
- 2 GPT-4 추론 능력 앞서, AI 개발 패러다임 변화 예고.
- 3 오픈 웨이트 모델, 개발자 접근성 높여 혁신 기대.
AI 세계에서 크기가 전부라는 생각이 깨지고 있습니다. 마이크로소프트(MS)가 최근 공개한 'Phi-4-Reasoning-Plus(파이-4 리즈닝 플러스)'라는 새로운 AI 모델 때문입니다. 이 모델은 겨우 42억 개의 매개변수(파라미터, AI의 복잡도를 나타내는 단위)를 가졌지만, 복잡한 추리 문제 해결 능력에서는 클로드 3 하이쿠나 GPT-4 같은 훨씬 큰 모델들을 능가하는 성능을 보여주며 업계를 놀라게 했습니다. 단순히 조금 나아진 게 아니라, AI 개발의 방향 자체를 다시 생각하게 만드는 사건입니다.
결론적으로 Phi-4는 AI 개발에서 '크기가 클수록 좋다'는 기존 상식에 강력한 도전장을 던졌습니다. 특정 작업에서는 작고 효율적인 모델이 더 실용적이고 효과적일 수 있음을 증명한 것입니다. 이는 앞으로 AI가 더 지속 가능하고 접근하기 쉬운 방향으로 발전할 수 있다는 신호탄입니다. AI 개발, 이제 무조건 큰 게 능사는 아니겠습니다.
그래서 뭐가 다른데?
MS는 AI 모델 크기를 무작정 키우는 대신, 훈련 데이터의 '질'에 집중했습니다. Phi-4는 엄선된 합성 데이터와 실제 데이터를 섞어 학습했는데, 특히 새롭고 독특한 정보 위주로 훈련시켜 효율성을 높였습니다. 마치 교과서를 통째로 외우는 대신 핵심 요약본과 응용 문제 풀이로 실력을 키운 셈입니다. 여기에 강화학습(RL)이라는 특별 훈련법과 GRPO라는 최적화 기술을 더해 추론 능력을 극한까지 끌어올렸습니다. 약 6,400개의 까다로운 수학 문제를 풀게 하면서 정확하고 간결하게 답하는 능력을 단련시킨 것이죠. 이런 똑똑한 훈련 방식 덕분에 Phi-4는 작은 덩치에도 불구하고 강력한 성능을 낼 수 있게 되었습니다.얼마나 대단하길래?
Phi-4의 성능은 이론만이 아닙니다. 실제로 어려운 수학 시험(AIME 2025) 문제 풀이에서 6,710억 개의 매개변수를 가진 거대 모델 '딥시크 R1'에 버금가는 성적을 거뒀습니다. 이는 Phi-4가 복잡한 수학적 사고 능력을 갖췄음을 보여줍니다. MS는 유레카(Eureka)라는 평가 도구를 사용해 Phi-4의 추론 능력을 철저히 검증했다고 밝혔습니다. 단순히 정보를 기억하는 것을 넘어, 주어진 정보를 바탕으로 논리적인 결론을 도출하는 능력이 뛰어나다는 의미입니다. 작은 엔진으로 스포츠카의 성능을 내는 것과 비슷하다고 볼 수 있습니다.누구나 쓸 수 있다고?
더 놀라운 점은 Phi-4가 '오픈 웨이트' 모델이라는 것입니다. 즉, 개발자들이 자유롭게 이 모델을 가져다가 연구하거나 자신의 서비스에 적용할 수 있도록 공개했다는 뜻입니다. 심지어 전문가용 서버 없이 일반 노트북이나 스마트폰에서도 작동할 수 있을 정도로 가볍습니다. 기업 고객은 MS의 애저 AI 스튜디오를 통해, 개인 개발자는 허깅페이스 같은 플랫폼에서 쉽게 Phi-4를 만나볼 수 있습니다. 최첨단 AI 기술이 더 이상 소수 거대 기업의 전유물이 아니라, 모두에게 열린 가능성이 된 것입니다.단점은 없어?
물론 Phi-4도 만능은 아닙니다. 훈련 데이터가 추론 능력 강화에 집중되어 있어, 세상의 모든 잡다한 지식까지 알지는 못합니다. GPT-4처럼 아주 창의적인 글쓰기나 여러 언어를 유창하게 구사하는 능력은 상대적으로 부족할 수 있습니다. 또한 긴 문서를 한 번에 이해하거나 복잡한 코드를 완벽하게 짜는 데는 한계가 있을 수 있으며, 다른 AI 모델처럼 학습 데이터에 포함된 편견을 드러낼 위험도 있습니다. 때로는 틀린 정보를 그럴듯하게 말할 수도 있으니 주의가 필요합니다.모델 | 파라미터 | 강점 | 한계점 |
---|---|---|---|
Phi-4-Reasoning-Plus | 42억 개 | 효율성, 강한 추론 능력, 오픈 웨이트, 일반 하드웨어 구동 | 제한된 일반 지식, 편향 가능성, 영어 중심 |
Claude 3 Haiku | 훨씬 큼 | 넓은 지식, 섬세한 표현, 강력한 일반 능력 | 높은 연산 비용, 비공개 소스, 낮은 접근성 |
GPT-4 | 매우 큼 | 방대한 지식, 창의적 능력, 다재다능함 | 높은 자원 요구, 부정확성 가능, 비싼 비용 |
DeepSeek R1 | 6,710억 개 | 뛰어난 추론 능력, 거대 지식 기반, 최첨단 성능 | 매우 높은 자원 요구, 제한된 접근성, 높은 에너지 소비 |
DeepSeek-R1-Distill-70B | 700억 개 | 강력한 추론 능력, 크기와 성능 균형, 정제된 지식 | 상당한 자원 필요, 대형 모델보다 다재다능함 부족, 지식 손실 가능성 |
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0작은 AI가 큰 AI를 이길 수 있을까?
가능하다
0%
0명이 투표했어요
불가능하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



