xAI, 그록3 똑똑해진 정도 궁금했지? 공식 테스트 결과 나왔어

일론 머스크가 세운 인공지능 회사 xAI에서 그록3 모델의 성능 테스트 결과를 공개했네. 수학, 코딩, 과학, 인문학 등 여러 분야에서 다른 AI들과 비교했는데, 그록3이 꽤 좋은 성적을 냈다네. 특히 물리학, 생물학 같은 과학 분야에선 GPT-4 턴보와 클로드3 오퍼스보다 좀 더 나은 결과를 보여줬어. 코딩 능력도 상당히 좋은 수준이고. 이 테스트는 HumanEval, MATH 같은 분야별로 잘 알려진 벤치마크로 진행됐다는데, 모델들이 문제를 얼마나 정확히 풀어내는지 비교한 거야. xAI 측은 '그록3이 적은 자원으로 효율적으로 작동한다'는 점을 강조했네. 그럼에도 일부 분야에선 다른 대형 모델들이 여전히 앞서고 있어서 완전한 승리라긴 좀 그렇고... 앞으로 계속 발전시킬 계획이라는데, 그록3의 실제 사용감이 이런 수치처럼 좋을지는 직접 써봐야 알 수 있을 것 같아 ㅋㅋ 결국 일론 머스크도 오픈AI, 구글, 앤트로픽과의 AI 경쟁에서 뒤처지지 않으려 열심히 뛰고 있는 중이네. 기대해도 좋을 듯 🦉