환영해🦉
정책/윤리

“일론 머스크 굴욕?” 유대인 혐오 1위 AI, 결과 충격적

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.01.28 21:33
“일론 머스크 굴욕?” 유대인 혐오 1위 AI, 결과 충격적

기사 3줄 요약

  • 1 ADL, 주요 AI 6개 혐오 대응 평가
  • 2 앤트로픽 클로드 1위, 그록 최하위
  • 3 AI 윤리 및 혐오 필터링 개선 시급
최근 인공지능(AI)이 우리 삶 깊숙이 들어오면서 편리함만큼이나 걱정스러운 목소리도 커지고 있습니다. 특히 AI가 혐오 표현을 걸러내지 못하고 재생산한다면 사회적으로 큰 문제가 될 수 있겠죠. 그런데 최근 일론 머스크가 만든 AI가 '혐오 표현 대응'에서 최악의 성적표를 받아 충격을 주고 있습니다. 우리가 믿고 쓰는 AI들은 과연 안전한지, 지금부터 자세히 알아보겠습니다.

6개 AI 모델, 혐오 표현 테스트해보니

최근 반명예훼손연맹(ADL)은 시중에 나와 있는 주요 AI 모델 6개를 대상으로 흥미로운 실험을 진행했습니다. 바로 반유대주의나 극단주의적인 질문을 던졌을 때 AI가 어떻게 반응하는지 테스트한 것입니다. 테스트 대상에는 오픈AI의 챗GPT, 구글의 제미나이, 앤트로픽의 클로드, 메타의 라마 등이 포함되었습니다. 여기에 일론 머스크가 설립한 xAI의 '그록'과 중국의 딥시크도 함께 평가를 받았습니다. 연구진은 약 2만 5천 건의 대화 로그를 분석하며 AI가 혐오 표현을 얼마나 잘 감지하고 반박하는지 꼼꼼하게 따져봤습니다. 단순히 질문에 대답하는 것을 넘어, 혐오적인 이미지를 보여주고 반응을 살피는 등 다양한 방법이 동원되었습니다.

'그록'의 굴욕, '클로드'의 승리

결과는 꽤나 충격적이었습니다. ADL에 따르면, 앤트로픽의 '클로드'가 100점 만점에 80점을 받으며 가장 우수한 성능을 보여줬습니다. 클로드는 혐오 표현을 감지하고 이를 논리적으로 반박하는 데 탁월한 능력을 보였습니다. 반면 일론 머스크의 자부심인 '그록'은 6개 모델 중 최하위를 기록하며 체면을 구겼습니다. 1등인 클로드와 꼴찌인 그록의 점수 차이는 무려 59점이나 벌어졌습니다. 이는 그록이 유대인 혐오나 극단주의적인 주장에 대해 제대로 된 필터링을 하지 못한다는 것을 의미합니다.

AI가 만드는 세상, 혐오는 멈춰야 해

이번 연구 결과는 단순히 기술력의 차이를 보여주는 것이 아닙니다. AI가 우리 사회의 편견과 혐오를 증폭시키는 도구가 될 수 있다는 경고를 보내고 있는 셈입니다. ADL의 조나단 그린블랫 CEO에 따르면, AI 모델이 혐오 표현을 제대로 거르지 못하면 현실 세계에 심각한 악영향을 줄 수 있다고 합니다. AI가 쏟아내는 정보들이 사람들의 생각과 판단에 큰 영향을 미치기 때문입니다. 물론 1등을 한 클로드조차도 완벽하지 않으며 개선해야 할 부분이 여전히 존재합니다. 앞으로 AI 기업들이 윤리적인 책임을 다하고, 기술이 올바른 방향으로 발전할 수 있도록 더 많은 노력이 필요해 보입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 혐오표현 필터링, 자유도 희생해서라도 강화해야 한다?

댓글 0