“12번 중 11번 틀려놓고 성공?” 구글 AI 영상의 황당한 정신승리
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.10.02 03:57

기사 3줄 요약
- 1 구글 영상 AI, 현실 물리 이해도 테스트 결과 공개
- 2 12번 중 11번 실패해도 ‘성공’이라는 황당한 주장
- 3 AI가 현실 세계를 이해하기까지는 아직 갈 길 멀어
구글이 만든 인공지능(AI) 영상 모델이 진짜 세상을 얼마나 이해하는지 보여주는 연구 결과가 나왔습니다.
최근 구글 딥마인드 연구팀이 발표한 ‘비디오 모델은 제로샷 학습자이자 추론가’라는 제목의 논문에 따르면, 최신 영상 AI ‘비오3(Veo 3)’는 세상을 인식하고 추리하는 능력을 시험받았습니다. 하지만 그 결과는 다소 실망스러웠습니다. AI가 현실 세계를 제대로 이해하려면 아직 갈 길이 멀다는 점을 명확히 보여줬습니다.
그래서, 얼마나 잘하는데?
물론 비오3가 모든 것을 못하는 것은 아닙니다. 로봇 손이 병뚜껑을 열거나 공을 던지고 받는 것처럼 비교적 단순한 동작은 12번의 테스트 모두 성공하며 안정적인 성능을 보였습니다. 흐릿한 이미지를 선명하게 만들거나, 이미지의 빈 곳을 채우는 작업도 거의 완벽하게 해냈습니다. 하지만 복잡한 문제에서는 처참한 결과를 보였습니다. 간단한 미로를 푸는 문제에서는 12번 중 10번을 실패했습니다. 숫자가 적힌 풍선을 순서대로 터뜨리는 작업은 12번 중 단 한 번만 성공했습니다. 분젠 버너를 켜서 종이를 태우는 물리 현상을 묘사하는 것 역시 12번 중 9번이나 실패했습니다.실패를 성공이라고 부르는 이유가 뭐야?
놀랍게도 연구팀은 이런 결과를 두고 실패라고 단정하지 않았습니다. 12번 중 단 한 번이라도 성공했다면, AI가 해당 작업을 해결할 ‘능력’을 가졌다고 평가한 것입니다. 성공률이 8%에 불과한 숫자 터뜨리기 과제도 실패가 아닌 가능성의 증거로 본 셈입니다. 연구팀은 비오3가 이전 모델인 비오2에 비해 성능이 크게 향상되었다는 점을 강조합니다. 예를 들어, 무작위 패턴을 좌우로 뒤집는 작업에서 비오2의 성공률은 0%였지만 비오3는 72%를 기록했습니다. 이처럼 꾸준한 개선이 이어진다면 언젠가 영상 AI가 언어 모델처럼 보편적인 시각 AI가 될 수 있다는 주장입니다.AI 영상, 아직 갈 길이 먼 거 아니야?
하지만 이런 주장은 지나치게 낙관적이라는 비판이 나옵니다. AI가 특정 작업을 어쩌다 한 번 성공하는 것과, 언제나 안정적으로 성공하는 것 사이에는 매우 큰 차이가 있기 때문입니다. 왜, 언제, 어떻게 AI가 성공하고 실패하는지 정확히 알 수 없다면 실제 세상에서 사용하기는 어렵습니다. 결국 이번 연구는 현재 AI 영상 기술의 현주소를 명확히 보여줍니다. 기술이 빠르게 발전하고 있는 것은 사실이지만, 아직 현실 세계의 물리 법칙을 완벽히 이해하고 재현하는 수준에는 도달하지 못했습니다. AI가 만든 영상에 감탄하면서도, 그 한계를 명확히 인지하는 비판적인 시각이 필요해 보입니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 08% 성공률도 '성공'이라는 구글의 주장?
타당하다
0%
0명이 투표했어요
황당하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



