“구글 제미나이 잡았다?” 알리바바가 만든 ‘이 기술’ 화제
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2026.01.04 04:31
기사 3줄 요약
- 1 알리바바, 모바일 조작 AI ‘MAI-UI’ 공개
- 2 구글 제미나이 뛰어넘는 성능 기록 달성
- 3 오픈 소스로 공개해 누구나 사용 가능
스마트폰을 쓰다 보면 화면을 터치하고 앱을 켜는 게 귀찮을 때가 있죠.
이제는 인공지능(AI)이 알아서 스마트폰을 조작해 주는 시대가 올지도 모릅니다.
중국의 알리바바가 사람처럼 스마트폰 화면을 보고 직접 앱을 실행하는 새로운 AI 기술을 공개했기 때문입니다.
알리바바에 따르면, 이번에 공개한 ‘MAI-UI’라는 AI는 구글의 최신 AI인 제미나이(Gemini)보다 더 뛰어난 성능을 보였다고 합니다.
단순히 말만 하는 비서가 아니라, 실제로 내 폰을 움직이는 ‘진짜 비서’가 등장한 셈입니다.
폰을 눈으로 보고 손으로 쓴다?
보통 AI라고 하면 챗GPT처럼 글자로 대화하는 걸 떠올리기 쉽습니다. 하지만 이번에 알리바바가 공개한 AI는 스마트폰 화면을 눈으로 보는 것처럼 이해합니다. 화면 속에 있는 버튼이 어디에 있고, 어떤 기능을 하는지 정확하게 파악하는 능력을 갖췄습니다. 전문가들은 이걸 ‘그라운딩(Grounding)’ 기술이라고 부르는데, 쉽게 말해 AI가 “아, 여기에 ‘결제하기’ 버튼이 있구나”라고 인식하고 누르는 겁니다. 알리바바에 따르면, 이 AI는 사용자가 “배고픈데 음식 좀 시켜줘”라고 말하면 배달 앱을 켜고 메뉴를 고르는 과정까지 수행할 수 있다고 합니다. 기존 AI들이 화면을 잘 이해하지 못해 엉뚱한 곳을 누르던 실수를 크게 줄인 것이 핵심입니다.혼자서 다 하는 똑똑한 비서
이 AI의 또 다른 특징은 아주 똑똑하게 작동한다는 점입니다. 스마트폰 안에서 처리할 수 있는 간단한 일은 기기 스스로 해결하고, 복잡한 계산이 필요할 때만 인터넷 클라우드 서버의 힘을 빌립니다. 이렇게 하면 개인정보가 밖으로 새 나갈 걱정을 덜 수 있고, 처리 속도도 훨씬 빨라집니다. 실제로 알리바바는 이 방식을 통해 AI의 작업 속도를 33%나 높였다고 발표했습니다. 또한, 사용자의 명령이 모호하면 되물어보는 센스까지 갖췄습니다. 만약 우리가 “친구한테 돈 좀 보내줘”라고만 말하면, AI가 “어떤 친구에게, 얼마를 보낼까요?”라고 다시 물어보고 정확하게 일을 처리합니다. 이 기술은 누구나 무료로 쓸 수 있는 ‘오픈 소스’로 공개되어 더 많은 개발자가 활용할 수 있게 되었습니다.진짜 우리 삶이 바뀔까?
이번 기술 공개는 단순히 새로운 AI 모델이 나왔다는 것 이상의 의미가 있습니다. 구글이나 애플 같은 미국 기업들이 주도하던 모바일 AI 시장에서 중국 기업이 강력한 경쟁자로 떠올랐기 때문입니다. 특히 스마트폰 조작 능력 평가에서 구글의 제미나이 프로 모델을 넘어섰다는 점은 꽤 놀라운 성과입니다. 물론 아직 완벽한 것은 아닙니다. 하지만 개발자들이 이 기술을 활용해 다양한 앱과 서비스를 만든다면, 우리가 스마트폰을 쓰는 방식 자체가 완전히 바뀔 수도 있습니다. 앞으로는 손가락으로 화면을 터치하는 일보다, AI에게 말 한마디로 모든 걸 시키는 게 더 익숙해질지도 모릅니다. 알리바바가 쏘아 올린 이 기술이 앞으로 우리의 모바일 라이프를 어떻게 바꿔놓을지 기대가 됩니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0중국 AI가 내 폰 조작, 편리함 vs 보안 우려?
편리함
0%
0명이 투표했어요
보안우려
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사