“눈과 귀로 코딩하는 시대” 제미나이 꺾은 알리바바 큐원3.5-옴니
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.03.31 19:40
기사 3줄 요약
- 1 알리바바가 시청각 소통 가능한 큐원3.5-옴니 모델 출시
- 2 텍스트 입력 없이 영상과 음성만으로 코딩하는 기능 탑재
- 3 음성 추론 분야에서 구글 제미나이 성능 압도하며 저비용 실현
이제 키보드를 두드리지 않아도 프로그램이 만들어지는 세상이 왔습니다. 알리바바가 눈과 귀를 가진 새로운 인공지능 모델인 큐원3.5-옴니를 전격 공개했습니다.
이 모델은 텍스트를 넘어 이미지와 음성 그리고 영상까지 한 번에 이해하는 능력을 갖췄습니다. 기존 모델들과 달리 중간 변환 과정이 없어 처리 속도가 매우 빠릅니다.
구글 제미나이 성능을 넘어섰다
알리바바 발표에 따르면 큐원3.5-옴니-플러스는 음성 이해와 추론 분야에서 구글의 제미나이 3.1 프로를 앞질렀습니다. 1억 시간 이상의 방대한 데이터를 학습한 결과입니다. 이 모델은 초당 1프레임 속도로 10시간이 넘는 음성 데이터를 막힘없이 처리합니다. 또한 113개 언어를 인식하고 36개 언어로 자연스럽게 대답할 수 있습니다.화면만 보여줘도 코드가 뚝딱
가장 놀라운 기능은 시청각 바이브 코딩이라 불리는 새로운 방식의 개발 기능입니다. 사용자가 화면을 녹화해 보여주거나 목소리로 지시만 내려도 코드를 생성합니다. 카메라에 비친 공간의 분위기를 읽어내어 어울리는 웹사이트나 게임을 즉시 구현할 수도 있습니다. 인공지능이 개발 환경에 직접 참여하는 새로운 시대가 열린 셈입니다.성능은 최고인데 가격은 최저
이 인공지능은 성능뿐만 아니라 가격 측면에서도 엄청난 경쟁력을 확보했습니다. 플래시 버전의 경우 100만 토큰당 약 140원 정도의 아주 저렴한 비용으로 제공됩니다. 사용자는 큐원 챗 웹사이트나 허깅페이스 온라인 데모를 통해 직접 성능을 확인할 수 있습니다. 누구나 쉽게 고성능 인공지능을 경험할 수 있는 길이 열렸습니다.개발 패러다임이 완전히 바뀐다
큐원3.5-옴니의 등장은 단순히 성능 좋은 인공지능의 탄생 이상의 의미를 지닙니다. 사람의 의도를 시각과 청각으로 동시에 파악하여 결과물을 만드는 방식이 대세가 될 전망입니다. 알리바바의 이번 도전이 앞으로 인공지능 산업 전반에 어떤 변화를 몰고 올지 전 세계가 주목하고 있습니다. 우리 생활 속에 깊숙이 들어올 인공지능의 미래가 기대됩니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI가 코딩하면 개발자 일자리 사라질까?
사라진다
0%
0명이 투표했어요
안 사라진다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사