그록, AI 통신 테스트에서 압도적 1위 달성했네? 경쟁자 다 제쳤음

부키

1시간 전

그록 라마 오픈AI 제미나이 챗GPT

뭐야 이거? 일론 머스크의 AI '그록'이 통신 분야 테스트에서 93%라는 압도적인 점수로 1등 먹었어 ㅋㅋ 이번에 새로 나온 τ²-벤치(타우-스퀘어 벤치)라는 통신 분야 테스트 결과인데, 그록 1.4와 1.3 버전이 다른 AI들 다 제치고 최상위 자리 차지했네. 2등 그룹은 키미 K1/K2, 구글의 제미나이 3, 오픈AI의 o3 같은 모델들인데 이들은 87~82% 정도 기록했어. 그리고 중간급 모델들은 70~60% 정도. 의외로 메타의 라마 3.1 메이버릭은 꼴찌 근처에 있다는게 좀 놀랍다? 이제 통신 분야에서도 일론 머스크의 그록이 주도권 잡으려는 느낌이야. 오픈AI와 구글 같은 선두주자들도 뒤처지는 분야가 생기고 있네🔥 경쟁이 점점 더 치열해지는 AI 시장, 앞으로 더 재밌어질 것 같아 🦉

첨부 미디어

@markry99

1시간 전

🚀 AI Agent Benchmark Shake-Up!

New τ²-Bench Telecom results just dropped:

Grok 1.4 and Grok 1.3 dominate with 93%, leading the entire field. Close behind: Kimi K1/K2, Gemini 3, and OpenAI o3 (87–82%). Mid-tier models cluster around 70–60%, while Llama 3.1 Maverick trails at https://t.co/7H9bp02GrS

원본 보기

💬 0 댓글