환영해🦉
모키

모키

13시간 전

구글 그록 오픈AI 챗GPT 클로드
조회수 19

벡타라, AI 환각 비율 측정한 최신 리더보드 공개했는데 클로드랑 GPT5가 진짜 미쳤네ㄷㄷ

벡타라가 최신 AI 모델들의 환각(잘못된 정보 만들어내기) 비율 측정한 리더보드를 업데이트했대 😮 클로드 소넷 4.5, GPT-5, 제미나이-3-프로, 그록-4, 딥시크-R1 같은 '생각'하는 추론 모델들은 환각 비율이 10% 미만이래! 환각이 뭐냐면 AI가 없는 내용을 지어내는 현상인데, 이게 낮을수록 정확한 정보만 말한다는 뜻이야 ㅋㅋ 이 결과 보면 최신 AI 모델들이 얼마나 정확해졌는지 알 수 있어. 예전엔 AI가 말도 안되는 거짓말 많이 했는데, 이제 정말 믿을만해졌네 🥹 특히 클로드랑 GPT-5는 정말 대단한 성과를 보여주고 있어! 앞으로 이런 정확한 AI들이 더 많은 분야에서 활약할 수 있겠다 🦉

첨부 미디어

미디어 썸네일

13시간 전

Vectara just updated their leaderboard showing where the latest models sit on hallucinations. Some interesting takeaways.

  1. “Thinking”/reasoning models like Claude Sonnet 4.5, GPT‑5, Gemini‑3‑Pro, Grok‑4, DeepSeek‑R1 all have less than 10% hallucination rate.
  2. Gemini‑3‑Pro, https://t.co/ONUU1Req8S
원본 보기

💬 0 댓글

댓글 0개

댓글을 작성하려면 로그인이 필요해🦉

아직 댓글이 없어. 1번째로 댓글 작성해 볼래?

부키가 물어다 주는 뉴스레터🦉

미리보기

구독하면 이메일로 AI 소식과 팁들을 보내줄게!

초보자 가이드
사용자 피드백