환영해🦉
산업/비즈니스

“AI 1위 3시간 천하로 끝났다?” 일론 머스크 자존심 구긴 구글 제미나이 3

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.11.19 13:35
“AI 1위 3시간 천하로 끝났다?” 일론 머스크 자존심 구긴 구글 제미나이 3

기사 3줄 요약

  • 1 일론 머스크의 그록-4.1, AI 성능 벤치마크 1위 달성
  • 2 몇 시간 만에 구글 제미나이 3에 1위 자리 내줘
  • 3 AI 기술 개발 속도와 치열한 왕좌 쟁탈전 보여줘
일론 머스크가 이끄는 AI 기업 xAI가 새로운 대형언어모델(LLM) '그록-4.1'을 세상에 선보였습니다. 공개 직후 AI 성능 순위 1위를 차지하며 모두를 놀라게 했지만, 그 영광은 단 몇 시간에 그쳤습니다. 구글의 '제미나이 3'가 곧바로 더 높은 점수를 기록하며 1위 자리를 빼앗았기 때문입니다. 이 사건은 현재 AI 기술 경쟁이 얼마나 빠르고 치열하게 진행되고 있는지 명확히 보여줍니다.

3시간 만에 1위가 바뀌었다고?

xAI는 현지시간 17일 그록-4.1을 공개하며 성능을 증명하는 여러 평가 지표를 투명하게 공개했습니다. 공개 직후 그록-4.1은 전 세계 사용자들이 익명으로 AI 성능을 평가하는 플랫폼 'LM 아레나'에서 1483점을 기록하며 1위에 올랐습니다. 하지만 기쁨은 잠시였습니다. 불과 몇 시간 뒤, 구글이 공개한 제미나이 3가 1501점이라는 더 높은 점수로 순위표 가장 높은 곳에 이름을 올렸습니다. 순식간에 벌어진 순위 변동에 그록-4.1의 출시는 제미나이 3 소식에 묻혀 큰 주목을 받지 못했습니다.

그래서 그록 4.1 성능은 어떤데?

비록 1위 자리는 금방 내주었지만, 그록-4.1의 기술적 성과는 인상적입니다. 이 모델은 빠른 답변을 위한 '패스트 모드'와 어려운 문제를 단계적으로 푸는 '싱킹 모드' 두 가지로 작동합니다. 특히 이미지를 보고 해석하거나 동영상 내용을 파악하는 시각 기능이 크게 향상됐습니다. 한 번에 처리할 수 있는 정보의 양도 기존보다 3배 이상 늘어나, 이제 장편 소설 한 권 분량을 통째로 읽고 이해할 수 있는 수준이 됐습니다.

구라 치는 AI, 이젠 안녕?

AI의 가장 큰 단점 중 하나는 없는 사실을 만들어내는 '환각 현상'입니다. xAI에 따르면 그록-4.1은 이 환각 현상을 기존 모델보다 약 65%나 줄이는 데 성공했습니다. 또한 정보의 정확도를 나타내는 '팩트스코어' 오류율도 크게 낮췄습니다. 이는 AI가 제공하는 정보의 신뢰도가 높아졌다는 의미입니다. 유해한 질문이나 편향된 답변을 유도하는 공격적인 테스트에서도 0%의 성공률을 기록하며 안전성을 입증했습니다.

앞으로의 전망은?

일론 머스크는 그록-4.1을 '위대한 모델'이라 칭하며 만족감을 드러냈습니다. 하지만 아직은 X(전 트위터) 플랫폼이나 모바일 앱에서만 사용할 수 있고, 다른 기업들이 이 기술을 활용할 수 있는 개발자용 API는 공개되지 않았습니다. 이번 해프닝은 AI 왕좌를 차지하기 위한 거대 기술 기업들의 경쟁이 계속해서 가속화될 것임을 예고합니다. 앞으로 어떤 놀라운 기술이 등장해 우리의 삶을 바꾸게 될지 지켜보는 것도 흥미로운 관전 포인트가 될 것입니다.
편집자 프로필
편집: 이도윤 기자
이메일: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 성능 경쟁, 기술 발전에 도움될까?

댓글 0

관련 기사