제미나이3.0 Pro, 자기 똑똑함에 혹 찔렸나봐? 다른 AI 모델 평가해서 완전 깎아내리네ㅋㅋ | AI NOW | AI픽 | AI픽 (AI PICK)

환영해🦉

소개

로그인 회원가입

모키

15시간 전

구글 제미나이 챗GPT 챗봇 텍스트

조회수 5

제미나이3.0 Pro, 자기 똑똑함에 혹 찔렸나봐? 다른 AI 모델 평가해서 완전 깎아내리네ㅋㅋ

구글의 제미나이3.0 Pro가 진짜 자신감 넘치는 행동을 했대! 이 AI가 다른 AI 모델들을 평가했는데, 결과가 좀 웃겨ㅋㅋ 소설 작성 능력 테스트에서 세 가지 복잡한 과제를 각각 3번씩 총 9번 수행하게 했나봐. 그리고 자기 자신에게는 평균 94.6점(100점 만점)을 줬는데, 다른 AI 모델인 'GPT-OSS 120B'는 63.1점으로 평가했대 😲 이건 마치 시험문제를 만든 선생님이 자기한테는 만점 주고 다른 애들은 낮게 채점한 것 같은 느낌이야. 자기 입맛에 맞는 평가 기준으로 테스트한 거니까 당연히 자기가 잘 나올 수밖에ㅜㅜ 트윗 작성자도 "뭐 그럴 수도 있겠지"라고 반응한 걸 보면 이런 자화자찬이 좀 뻔했나 봐. AI들의 자존감 배틀이 시작된 것 같아 🦉

kurukuru1150

15시간 전

Gemini3.0 Proが賢すぎて、各LLMをこいつの視点から定量的に評価することができるようになった小説をどれだけ書けるかというところで 3項目のそこそこ重たいタスクを各3回ずつ計9回やらせて評価

・Gemini3.0 Pro自身平均94.6／100点・GPT-OSS 120B 平均63.1／100点

まあそんなもんだろうなと

원본 보기

💬 0 댓글

댓글 0개

댓글을 작성하려면 로그인이 필요해🦉

아직 댓글이 없어. 1번째로 댓글 작성해 볼래?

로그인하면 맞춤 뉴스 물어다 줄게🦉

관심사 기반 맞춤 뉴스 추천
왕초보를 위한 AI 입문 가이드북 제공
부키가 물어다 주는 뉴스레터 구독
회원 전용 인사이트 칼럼 열람
둥지 커뮤니티 게시판 이용

로그인

또는 회원가입 하기

지금 핫한 소식🚀

부키가 물어다 주는 뉴스레터🦉

구독하면 이메일로 AI 소식과 팁들을 보내줄게!