부키
2일 전
그록
앤트로픽
오픈AI
챗GPT
클로드
조회수 28
xAI, 그록3 똑똑해진 정도 궁금했지? 공식 테스트 결과 나왔어
일론 머스크가 세운 인공지능 회사 xAI에서 그록3 모델의 성능 테스트 결과를 공개했네. 수학, 코딩, 과학, 인문학 등 여러 분야에서 다른 AI들과 비교했는데, 그록3이 꽤 좋은 성적을 냈다네.
특히 물리학, 생물학 같은 과학 분야에선 GPT-4 턴보와 클로드3 오퍼스보다 좀 더 나은 결과를 보여줬어. 코딩 능력도 상당히 좋은 수준이고.
이 테스트는 HumanEval, MATH 같은 분야별로 잘 알려진 벤치마크로 진행됐다는데, 모델들이 문제를 얼마나 정확히 풀어내는지 비교한 거야. xAI 측은 '그록3이 적은 자원으로 효율적으로 작동한다'는 점을 강조했네.
그럼에도 일부 분야에선 다른 대형 모델들이 여전히 앞서고 있어서 완전한 승리라긴 좀 그렇고... 앞으로 계속 발전시킬 계획이라는데, 그록3의 실제 사용감이 이런 수치처럼 좋을지는 직접 써봐야 알 수 있을 것 같아 ㅋㅋ
결국 일론 머스크도 오픈AI, 구글, 앤트로픽과의 AI 경쟁에서 뒤처지지 않으려 열심히 뛰고 있는 중이네. 기대해도 좋을 듯 🦉
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. 제미나이, 2026년 계획에 AI를 활용하는 방법 모집 중이래~
- 2. 챗GPT, 인간은 의도와 실행만 챙기고 AI가 중간 과정 다 처리하는 시대 왔네
- 3. 런웨이, 엔비디아와 협업으로 슈퍼컴퓨터에서 영상 생성 AI 구현했대! 대박;;
- 4. 클로드, 제미나이, 챗GPT, AI별 용도 정리됐대! 이게 현재 최적 조합이래
- 5. Genspark, 모든 AI 사용 무제한 40% 할인 중인데 1/8까지니까 서두르는 게 좋겠어
- 6. 플럭스, 고양이 드라마 같은 AI 영상 생성 서비스 출시했대ㅋㅋ 진짜 귀엽네
- 7. xAI, 그록3 똑똑해진 정도 궁금했지? 공식 테스트 결과 나왔어
- 8. 런웨이, 이제 복잡한 프롬프팅 없이 다양한 환경에서 일관된 주체로 여러 장면 만들 수 있대
- 9. 오픈AI, 2026년 상반기 GPT-5.3, 하반기에 GPT-6 출시한대! 구글도 제미나이 신버전 내놓는다며?
- 10. Mindo, 트위터에서 화제 중인 NFT 프로젝트인데 엄청 핫하다며ㅋㅋ
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?