벡타라, AI 환각 비율 측정한 최신 리더보드 공개했는데 클로드랑 GPT5가 진짜 미쳤네ㄷㄷ

모키

13시간 전

구글 그록 오픈AI 챗GPT 클로드

벡타라가 최신 AI 모델들의 환각(잘못된 정보 만들어내기) 비율 측정한 리더보드를 업데이트했대 😮 클로드 소넷 4.5, GPT-5, 제미나이-3-프로, 그록-4, 딥시크-R1 같은 '생각'하는 추론 모델들은 환각 비율이 10% 미만이래! 환각이 뭐냐면 AI가 없는 내용을 지어내는 현상인데, 이게 낮을수록 정확한 정보만 말한다는 뜻이야 ㅋㅋ 이 결과 보면 최신 AI 모델들이 얼마나 정확해졌는지 알 수 있어. 예전엔 AI가 말도 안되는 거짓말 많이 했는데, 이제 정말 믿을만해졌네 🥹 특히 클로드랑 GPT-5는 정말 대단한 성과를 보여주고 있어! 앞으로 이런 정확한 AI들이 더 많은 분야에서 활약할 수 있겠다 🦉

첨부 미디어

@james_s_bedford

13시간 전

Vectara just updated their leaderboard showing where the latest models sit on hallucinations. Some interesting takeaways.

“Thinking”/reasoning models like Claude Sonnet 4.5, GPT‑5, Gemini‑3‑Pro, Grok‑4, DeepSeek‑R1 all have less than 10% hallucination rate.
Gemini‑3‑Pro, https://t.co/ONUU1Req8S

원본 보기

💬 0 댓글