구글·미드저니 긴장해! 中 괴물 AI 등장, 영상·이미지 판 뒤흔드나?
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.04.16 18:26

기사 3줄 요약
- 1 중국 콰이쇼우, AI 영상 생성기 'Kling 2.0' 출시
- 2 텍스트, 이미지, 비디오 입력 가능한 MVL 기술 탑재
- 3 구글 Veo 2 등 경쟁 모델 능가 주장, API도 공개
최근 AI 기술 분야, 특히 영상 생성 분야에서 중국의 움직임이 심상치 않습니다. 중국의 거대 콘텐츠 플랫폼 콰이쇼우(Kuaishou)가 자사의 AI 영상 생성 모델 'Kling 2.0'을 공개하며 글로벌 시장에 도전장을 내밀었습니다. 이미 2200만 명의 사용자를 확보하고, 1200만 개의 이미지와 4000만 개의 영상을 만들어냈다고 하니, 그 기세가 대단합니다. Kling 2.0은 단순히 텍스트를 영상으로 바꾸는 것을 넘어, 기존 영상을 입력받아 새로운 영상을 만드는 기능까지 갖췄다고 하는데요. 과연 Kling 2.0이 AI 영상 제작 시장의 판도를 바꿀 게임 체인저가 될 수 있을지 자세히 살펴보겠습니다.
물론 Kling 2.0도 완벽하지는 않습니다. 학습 데이터에 숨어있는 편견 때문에 결과물이 왜곡될 수 있고, 너무 복잡하거나 애매한 요구에는 제대로 작동하지 않을 수도 있습니다. 또한 고품질 영상을 만들려면 상당한 컴퓨터 자원이 필요해, 10초짜리 영상을 만드는 데 약 2달러(약 2,700원) 정도의 비용이 드는 것으로 알려졌습니다. 이는 일반 사용자가 부담 없이 사용하기에는 다소 높은 가격일 수 있습니다. Kling 2.0이 AI 영상 제작의 새로운 가능성을 보여준 것은 분명하지만, 객관적인 성능 검증과 함께 이러한 한계점들을 어떻게 극복해 나갈지 지켜봐야 할 것입니다.
Kling 2.0, 대체 뭐길래?
Kling 2.0의 핵심 기술은 'MVL(Multi-modal Visual Language)'입니다. 쉽게 말해, 글자(텍스트), 그림(이미지), 영상(비디오) 등 다양한 형태의 정보를 동시에 이해하고 처리하는 똑똑한 기술입니다. 이 기술 덕분에 사용자가 원하는 내용을 글이나 이미지, 심지어 영상으로 입력해도 Kling 2.0은 찰떡같이 알아듣고 그에 맞는 영상을 만들어낼 수 있습니다. 예를 들어, '해변에서 뛰어노는 강아지'라는 글을 입력하면 그에 맞는 영상을 만들어주고, 웃는 사람 사진을 넣으면 그 사람이 활짝 웃는 영상으로 바꿔주는 식입니다. 기존 AI보다 사용자의 의도를 더 정확히 파악하고, 훨씬 자연스럽고 일관성 있는 영상을 만들 수 있다는 것이 큰 장점입니다.구글보다 낫다고? 진짜?
콰이쇼우 측은 Kling 2.0이 AI 영상 모델 성능 평가에서 1위를 차지했고, 심지어 구글의 최신 모델인 'Veo 2'보다 뛰어나다고 주장하고 있습니다. 내부 테스트 결과, 이미지를 영상으로 만드는 성능에서 구글 Veo 2 대비 182%, Runway Gen-4 대비 178%의 우위를 보였다고 하는데요. 얼마나 사실적인지, 영상의 흐름이 얼마나 자연스러운지, 만드는 속도는 얼마나 빠른지 등을 종합적으로 평가했을 것으로 추정됩니다. 하지만 아직 객관적인 외부 기관의 검증이나 표준화된 평가 기준이 부족하기 때문에, 이 주장을 100% 믿기는 어렵습니다. 앞으로 독립적인 비교 평가 결과가 나와야 Kling 2.0의 진짜 실력을 알 수 있을 것입니다.개발자들 신났네! API 뭐 할 수 있어?
Kling 2.0은 개발자들이 이 기술을 활용해 다양한 서비스를 만들 수 있도록 API(Application Programming Interface, 응용 프로그래밍 인터페이스)를 공개했습니다. 이 API를 이용하면 개발자들은 텍스트를 영상으로 만들거나, 이미지를 움직이는 영상으로 바꾸거나, 특정 화풍(예: 반 고흐 스타일)을 영상에 입히는 등 다양한 기능을 자신의 서비스에 탑재할 수 있습니다. AI를 이용한 영상 편집 기능도 제공되어, 영상 제작 과정을 훨씬 쉽고 편리하게 만들 수 있습니다. 벌써 1만 5천 명 이상의 개발자가 이 API를 활용하고 있다고 하니, 앞으로 Kling 2.0 기반의 신기하고 재미있는 서비스들이 많이 등장할 것으로 기대됩니다. 예를 들어, 광고 영상을 자동으로 만들거나, 쇼핑몰 상품 영상을 고객 맞춤형으로 제작하는 것도 가능해질 수 있습니다.이미지 생성도 미드저니 뛰어넘나? 그리고 한계는?
Kling 2.0에는 'Kolors 2.0'이라는 이미지 생성 기능도 포함되어 있는데, 이 역시 유명 이미지 생성 AI인 'Midjourney V7'보다 뛰어나다고 주장합니다. 특히 원하는 그림 스타일을 사진에 자연스럽게 적용하는 능력이나 이미지 생성 속도, 사용자의 요구를 정확히 반영하는 능력 등에서 앞선다고 하는데요. 이 또한 Midjourney V7과의 직접적인 비교 검증이 필요한 부분입니다.플랫폼 | 강점 | 약점 | 주요 용도 |
---|---|---|---|
Kling 2.0 | 프롬프트 이해도 높음, 멀티모달 입력 가능, 멀티 요소 편집기 | 연산 효율성, 복잡한 장면 처리 어려움, 소스 비공개 | 마케팅 콘텐츠, 개인 맞춤 영상, 영상 편집 |
Runway Gen-2 | 사용 편리성, 다양한 기능 | Veo 대비 사실성 부족 가능성, 이미지 변형 문제 | 범용 영상 제작, 빠른 프로토타입 제작 |
Pika Labs | 애니메이션, 스타일화된 비디오 | 사실성 제한적, 품질 불일치 | 창의적 콘텐츠, 소셜 미디어, 짧은 영상 |
Google Veo | 사실성, 영화 같은 렌더링 | 접근성 제한(대기 명단), 복잡한 프롬프트 처리 어려움, 미국 전용 | 전문 영상 제작, 영화 같은 콘텐츠 |
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0중국 AI 영상기술, 구글 능가할까?
가능하다
0%
0명이 투표했어요
불가능하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



