환영해🦉
기술/연구

"진짜 다 보여?" 일론 머스크 Grok Vision, ChatGPT 뛰어넘을까

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.04.23 08:52
"진짜 다 보여?" 일론 머스크 Grok Vision, ChatGPT 뛰어넘을까

기사 3줄 요약

  • 1 일론 머스크 xAI, 이미지 인식 AI 'Grok Vision' 공개
  • 2 사진 보고 질문 답하는 기능, X 플랫폼 등서 이용 가능
  • 3 ChatGPT, 제미나이와 경쟁, 성능·가격 비교 주목
일론 머스크가 이끄는 인공지능 회사 xAI가 또 한 번 AI 판에 도전장을 내밀었습니다. 바로 ‘보는’ AI, ‘Grok Vision’을 선보인 건데요. 구글의 제미나이나 OpenAI의 ChatGPT처럼 이미지를 이해하는 능력을 갖춘 이 새로운 AI가 과연 기존 강자들을 위협할 수 있을지 관심이 뜨겁습니다. 지금까지 AI 챗봇은 주로 글자를 이해하고 답하는 데 능숙했지만, 이제는 눈까지 달게 된 셈입니다. Grok Vision은 우리가 보여주는 사진 속 세상을 ‘보고’ 그에 대해 답해줄 수 있다고 하는데요. 이게 정말 세상을 바꿀 만한 기술일까요? 아니면 또 하나의 그럴듯한 경쟁자 등장일 뿐일까요?

그래서 Grok Vision, 이게 뭔데?

Grok Vision은 쉽게 말해 사진이나 그림 같은 이미지를 보고 이해하는 AI입니다. 스마트폰으로 제품 사진을 찍어 이게 뭐냐고 묻거나, 표지판 사진을 보여주고 무슨 뜻이냐고 물어볼 수 있는 거죠. 문서나 복잡한 도표 사진을 보여주고 내용을 요약해달라고 할 수도 있습니다. 처음에는 아이폰(iOS)에서만 쓸 수 있었지만, 이제는 일론 머스크가 운영하는 소셜 미디어 X(전 트위터)에서도 사용할 수 있고, 웹사이트나 아이폰 전용 앱도 나왔습니다. 다만 안드로이드 스마트폰 사용자는 아직 바로 쓰기 어렵고, 월 30달러(약 4만원)짜리 유료 구독 서비스(SuperGrok)에 가입해야 할 수도 있다고 하네요.

ChatGPT보다 똑똑해? 성능 파헤치기

xAI 측은 Grok Vision이 문서, 도표, 사진 등 다양한 시각 정보를 처리할 수 있다고 자랑합니다. 특히 ‘RealWorldQA’라는, 현실 세계의 사물이나 공간을 얼마나 잘 이해하는지 평가하는 테스트에서 68.7%라는 높은 점수를 받으며 GPT-4V(ChatGPT의 이미지 인식 버전)나 구글 제미나이 프로 1.5 같은 경쟁 모델들보다 특정 분야에서 뛰어날 수 있다는 가능성을 보여줬습니다. 손으로 대충 그린 스케치를 보고 프로그래밍 코드를 만들어주는 재주도 부린다고 하니, 꽤 똑똑해 보이긴 합니다. 또한 여러 나라 언어를 더 잘 알아듣고 답할 수 있도록 성능을 개선했고, 실시간 검색 기능(DeepSearch)으로 웹사이트나 X 게시글을 뒤져 최신 정보까지 답해준다고 합니다.

아직 부족한 점은 없어?

물론 장점만 있는 것은 아닙니다. 초기 버전 사용자들은 Grok Vision이 ChatGPT-4보다는 논리적으로 생각하는 능력이 다소 부족하고, 복잡한 질문에는 엉뚱한 답을 내놓는 경우도 있다고 지적합니다. 현실 세계 정보를 얼마나 정확하고 일관성 있게 이해하는지도 아직 검증이 더 필요해 보입니다. 가장 큰 한계 중 하나는 유튜브 같은 동영상 플랫폼의 내용은 전혀 볼 수 없다는 점입니다. 또한 이런 이미지 인식 AI 기술이 딥페이크처럼 나쁜 목적으로 악용될 수 있다는 걱정도 나옵니다. 가짜 정보를 만들거나 유해한 콘텐츠를 생성하는 데 쓰일 수 있기 때문에, 안전 장치 마련이 중요합니다.

그래서 누가 제일 나아?

간단히 표로 비교해 볼까요?
기능 Grok Vision 제미나이 ChatGPT
이미지 처리 문서, 도표, 사진 이미지, 동영상, 실시간 카메라 이미지
공간 이해력 (RealWorldQA 점수 기준) 매우 우수 (68.7%) 우수 보통
실시간 검색 지원 (DeepSearch) 지원 (구글 검색 연동) 지원 (Bing 연동)
추론 능력 보통 매우 우수 매우 우수
가격 (고급 기능 기준) 월 $40 (X Premium+) 월 $20 (Gemini Advanced) 월 $20 (ChatGPT Plus)
결론적으로 Grok Vision은 ‘보는 AI’ 분야에서 확실히 주목할 만한 신인입니다. 하지만 아직 제미나이나 ChatGPT 같은 기존 강자들을 완전히 따라잡았다고 보기는 어렵습니다. 특히 추론 능력이나 안정성 면에서는 개선이 필요해 보이고, 가격도 경쟁자들보다 비싸다는 단점이 있습니다. 과연 Grok Vision이 일론 머스크의 호언장담처럼 AI 시장의 판도를 바꿀 수 있을까요? 아니면 수많은 경쟁자 중 하나로 남게 될까요? 앞으로 Grok Vision이 얼마나 더 똑똑해지고 사용자들에게 유용한 도구가 될 수 있을지 지켜봐야 할 것 같습니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

일론 머스크의 Grok Vision, AI 혁명일까?

댓글 0

관련 기사