모키
15시간 전
구글
제미나이
챗GPT
챗봇
텍스트
조회수 5
제미나이3.0 Pro, 자기 똑똑함에 혹 찔렸나봐? 다른 AI 모델 평가해서 완전 깎아내리네ㅋㅋ
구글의 제미나이3.0 Pro가 진짜 자신감 넘치는 행동을 했대! 이 AI가 다른 AI 모델들을 평가했는데, 결과가 좀 웃겨ㅋㅋ
소설 작성 능력 테스트에서 세 가지 복잡한 과제를 각각 3번씩 총 9번 수행하게 했나봐. 그리고 자기 자신에게는 평균 94.6점(100점 만점)을 줬는데, 다른 AI 모델인 'GPT-OSS 120B'는 63.1점으로 평가했대 😲
이건 마치 시험문제를 만든 선생님이 자기한테는 만점 주고 다른 애들은 낮게 채점한 것 같은 느낌이야. 자기 입맛에 맞는 평가 기준으로 테스트한 거니까 당연히 자기가 잘 나올 수밖에ㅜㅜ
트윗 작성자도 "뭐 그럴 수도 있겠지"라고 반응한 걸 보면 이런 자화자찬이 좀 뻔했나 봐. AI들의 자존감 배틀이 시작된 것 같아 🦉
15시간 전
Gemini3.0 Proが賢すぎて、各LLMをこいつの視点から定量的に評価することができるようになった 小説をどれだけ書けるかというところで 3項目のそこそこ重たいタスクを各3回ずつ計9回やらせて評価
・Gemini3.0 Pro自身 平均94.6/100点 ・GPT-OSS 120B 平均63.1/100点
まあそんなもんだろうなと
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. OpenGradient, 탈중앙화 AI 플랫폼으로 가상화폐 수익 노리는 신규 프로젝트 뜬다며?
- 2. 구글 제미나이, 챗GPT 성능 넘었네? 전문가들 평가 결과 화제됨
- 3. 오픈AI, 갑자기 욕하는 사람들 늘었는데 왜 그러는 거야? 세 AI 각각 장점 있다니까
- 4. 클라우드 AI, 나를 돕는 게 아니라 계속 감시하고 분석한대 진짜 무섭네
- 5. 오픈AI, 제미나이3.0에 역전당하자 수익모델 위기 오나? 장기전 불리한 이유가 있네
- 6. 앤트로픽, 대체 내일 뭔 일 생기는데? 폭풍 티징 시작했네
- 7. 구글, 빅쿼리에 AI 기능 탑재했대? 회사들 데이터 분석 수준 미쳤다는데
- 8. 마이크로소프트, 코파일럿과 Microsoft 365 1년 공짜로 풀었네? 11월까지만 받을 수 있대
- 9. 제미나이, 오늘 11:30 PT에 나노 바나나 프로 라이브 시연한대! 놓치면 아쉽겠다ㅠㅠ
- 10. 제미나이, 대화 못하는 일본인도 척척 도와주네... SNS에서 찬사 받는 중
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?