“사람 손길 이제 필요 없다?” 클릭하고 입력하는 구글 AI 등장
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.10.08 09:54

기사 3줄 요약
- 1 구글, 사람처럼 웹서핑하는 AI '제미나이 2.5' 공개
- 2 클릭, 타이핑, 스크롤까지… 복잡한 웹 작업 자동 수행
- 3 성능 벤치마크서 OpenAI, 앤트로픽 모델 모두 앞서
구글이 사람처럼 웹 브라우저를 조작하는 새로운 인공지능(AI) 모델 '제미나이 2.5 컴퓨터 사용(Gemini 2.5 Computer Use)'을 공개했습니다.
이 AI는 단순히 정보를 찾는 것을 넘어, 인간의 디지털 활동을 그대로 따라 합니다. 마우스 클릭, 스크롤, 키보드 타이핑 등 사람이 컴퓨터로 하는 거의 모든 작업을 스스로 수행할 수 있습니다.
진짜 사람처럼 움직인다고?
제미나이 2.5 모델은 화면을 시각적으로 이해하는 능력을 바탕으로 작동합니다. 마치 사람이 모니터를 보고 상황을 파악하듯, AI는 컴퓨터 화면의 스크린샷을 보고 사용자의 명령을 어떻게 수행할지 판단합니다. 예를 들어 '이 양식을 작성해 줘'라는 명령을 받으면, AI는 화면 속 양식의 위치를 파악하고 각 항목에 맞는 정보를 키보드로 입력한 뒤 '제출' 버튼을 마우스로 클릭합니다. 이 모든 과정이 API 같은 별도의 프로그래밍 연결 없이, 오직 화면을 보고 판단하는 능력만으로 이루어집니다.ChatGPT보다 성능이 좋다고?
구글에 따르면 제미나이 2.5 모델의 성능은 이미 경쟁자들을 뛰어넘었습니다. 웹 AI 에이전트의 성능을 평가하는 대표적인 기준인 '온라인-마인드투웹(Online-Mind2Web)' 벤치마크에서 69.0%의 성공률을 기록했습니다. 이는 OpenAI의 에이전트 모델이 기록한 61.3%를 크게 앞서는 수치입니다. 다른 벤치마크에서도 경쟁 모델인 앤트로픽의 클로드보다 우수한 성능을 보이며 기술력을 입증했습니다.벤치마크 | 제미나이 2.5 | OpenAI 에이전트 | 클로드 소네트 4.5 |
---|---|---|---|
온라인-마인드투웹 | 69.0% | 61.3% | - |
웹보이저 | 88.9% | 87.0% | - |
안드로이드 월드 | 69.7% | - | 56.0% |
그래서 이걸로 뭘 할 수 있는데?
이 기술의 활용 분야는 무궁무진합니다. 웹사이트에서 반복적으로 데이터를 입력하거나 정보를 수집하는 작업, 소프트웨어의 사용자 인터페이스(UI)를 자동으로 테스트하는 일 등이 대표적입니다. 이미 구글 내부에서는 소프트웨어 개발 속도를 높이기 위해 UI 테스트에 이 모델을 활용하고 있습니다. 앞으로는 쇼핑 목록에 있는 상품을 온라인 쇼핑몰 장바구니에 자동으로 담는 등 개인 비서 역할까지 수행할 전망입니다.장밋빛 미래만 있는 건 아니지?
물론 해결해야 할 과제도 남아있습니다. AI가 사람의 의도와 다르게 작동하거나 악용될 가능성을 배제할 수 없습니다. 또한 AI 모델 특유의 '환각(Hallucination)' 현상, 즉 사실이 아닌 정보를 만들어내는 문제도 여전합니다. 구글은 이러한 위험을 막기 위해 모델 자체에 안전 기능을 내장하고 개발자들에게도 맞춤형 안전 정책을 설정할 수 있도록 지원한다고 밝혔습니다. AI가 우리의 디지털 세계에 깊숙이 들어오는 만큼, 기술 발전과 함께 윤리적 고민도 더욱 중요해지고 있습니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI가 웹서핑까지 대체하는 시대, 환영?
환영
0%
0명이 투표했어요
우려
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



