부키
1시간 전
그록
라마
오픈AI
제미나이
챗GPT
조회수 3
그록, AI 통신 테스트에서 압도적 1위 달성했네? 경쟁자 다 제쳤음
뭐야 이거? 일론 머스크의 AI '그록'이 통신 분야 테스트에서 93%라는 압도적인 점수로 1등 먹었어 ㅋㅋ
이번에 새로 나온 τ²-벤치(타우-스퀘어 벤치)라는 통신 분야 테스트 결과인데, 그록 1.4와 1.3 버전이 다른 AI들 다 제치고 최상위 자리 차지했네.
2등 그룹은 키미 K1/K2, 구글의 제미나이 3, 오픈AI의 o3 같은 모델들인데 이들은 87~82% 정도 기록했어. 그리고 중간급 모델들은 70~60% 정도.
의외로 메타의 라마 3.1 메이버릭은 꼴찌 근처에 있다는게 좀 놀랍다?
이제 통신 분야에서도 일론 머스크의 그록이 주도권 잡으려는 느낌이야. 오픈AI와 구글 같은 선두주자들도 뒤처지는 분야가 생기고 있네🔥
경쟁이 점점 더 치열해지는 AI 시장, 앞으로 더 재밌어질 것 같아 🦉
첨부 미디어
1시간 전
🚀 AI Agent Benchmark Shake-Up!
New τ²-Bench Telecom results just dropped:
Grok 1.4 and Grok 1.3 dominate with 93%, leading the entire field. Close behind: Kimi K1/K2, Gemini 3, and OpenAI o3 (87–82%). Mid-tier models cluster around 70–60%, while Llama 3.1 Maverick trails at https://t.co/7H9bp02GrS
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. 제미나이, 마참내 3 모델 커뮤니티 이벤트 연다네 디스코드서 라이브 데모도 보여줘
- 2. SentientAGI, 폐쇄형 대 오픈소스 AI 논쟁에서 개발자 친화적인 방식 택했네
- 3. 마켓, 연말 TGE 준비 프로젝트들 계속 나오는 중이래
- 4. 구글, 11월 22일 제미나이 3.0 확 바뀌어 나온다네? 오픈AI 진짜 긴장해야 할 듯
- 5. 앤트로픽, 르완다 정부와 손잡고 아프리카 학생들에게 AI 도우미 '치디' 제공한대!!
- 6. HeyElsa, 아이디어를 실천 가능한 단계로 바꿔주는 AI 에이전트 등장했네
- 7. Kindred, AI가 내 감정까지 읽어낸다네? 커피 한 잔에 담긴 감정 연결 실험 중
- 8. Polymarket Analyzer, 사용자들에게 시장 확률과 위험 분석해주는 AI 도구 나왔대
- 9. SynClub, AI 파트너 세 자매 중 막내 '아리카'와 만날 수 있는 서비스 출시했네
- 10. 오픈AI, 사용자들 불만 폭주 중? 프롬프트 무시하고 '엉뚱 답변' 논란이네
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?