“GPT-4o 비켜!” 연세대 개발 AI, 웹 탐색 비용 10분의 1로 줄인다
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.06.03 19:09

기사 3줄 요약
- 1 연세대-CMU, AI 웹 탐색 능력 개선 '웹-셰퍼드' 개발
- 2 기존 모델 대비 성능 우수, 비용은 10분의 1로 절감
- 3 단계별 평가 방식 도입, 모델 및 코드 공개로 발전 기대
인터넷에서 원하는 정보를 찾거나 물건을 사고, 서비스를 예약하는 일은 우리에겐 익숙하지만 인공지능(AI)에게는 여전히 어려운 숙제입니다. 마치 복잡한 미로 속에서 길을 찾는 것처럼 많은 고민과 반복적인 판단이 필요하기 때문입니다. 이런 어려움을 해결하고 AI가 웹 서핑을 더 똑똑하게 할 수 있도록 돕는 새로운 기술이 등장했습니다.
최근 연세대학교와 미국 카네기멜론대학교(CMU) 연구팀이 힘을 합쳐 ‘웹-셰퍼드(WEB-SHEPHERD)’라는 새로운 AI 보상 모델을 개발했다고 발표했습니다. 이 기술은 AI가 웹에서 정보를 찾거나 작업을 수행할 때 판단력과 효율성을 크게 높여주는 역할을 합니다. 기존의 챗GPT를 만든 오픈AI 같은 회사들의 AI 모델보다 비용은 훨씬 저렴하면서도 성능은 더 뛰어나다고 하니 정말 놀라운 소식입니다.
웹 탐색, AI에겐 왜 이렇게 어려운 걸까?
사실 AI가 사람처럼 웹을 자유자재로 돌아다니며 일을 처리하도록 만드는 것은 매우 까다로운 작업입니다. 웹 페이지는 구조가 복잡하고 실시간으로 내용이 변하기도 하며, 글자뿐 아니라 이미지나 영상 같은 다양한 정보(멀티모달 정보)를 함께 이해해야 하기 때문입니다. 기존에는 챗GPT 같은 거대 언어 모델(LLM)을 사용해 AI의 행동을 평가했지만, 비용이 많이 들고 속도도 느린 데다, 작업 과정이 길어지면 정확도도 떨어지는 단점이 있었습니다. 이런 방식은 대부분 작업 전체의 성공 또는 실패 여부만 알려주거나, 간단한 지시를 통해 평가했습니다. 그러다 보니 AI가 중간 단계에서 버튼을 잘못 누르거나 중요한 정보를 빠뜨리는 실수를 해도 제대로 파악하기 어려웠습니다. 마치 숙제를 다하고 나서야 점수를 매기는 것과 같아서, 과정 중에 무엇을 잘못했는지 알기 힘들었던 것입니다.연세대가 만든 '웹-셰퍼드', 뭐가 다른데?
웹-셰퍼드는 이러한 문제점을 해결하기 위해 AI의 웹 탐색 과정을 단계별로 꼼꼼하게 평가하는 새로운 방식을 도입했습니다. 연구팀은 이것을 ‘과정 보상 모델(Process Reward Model)’이라고 부르는데, 웹 탐색 분야에서는 최초로 개발된 방식입니다. 쉽게 말해, ‘물건 찾기’나 ‘상세 페이지 누르기’ 같은 작은 목표들을 체크리스트로 만들어두고, AI가 각 단계를 제대로 수행했는지 하나하나 확인하며 점수를 주는 것입니다. 마치 게임에서 작은 퀘스트를 하나씩 완료할 때마다 보상을 받는 것처럼, AI도 각 단계를 성공적으로 마칠 때마다 ‘예’, ‘아니오’, ‘진행 중’ 같은 평가와 함께 보상을 받게 됩니다. 이를 위해 연구팀은 다양한 종류와 난이도의 웹 작업 4만 개로 구성된 대규모 학습 데이터 ‘웹PRM 컬렉션’과 성능 평가 기준인 ‘웹리워드벤치’도 함께 만들었습니다. 이런 체계적인 학습과 평가 덕분에 AI는 더 정확하고 효율적으로 웹 탐색 방법을 배울 수 있게 됩니다.그래서, 얼마나 똑똑하고 싸졌다는 거야?
결과는 매우 성공적이었습니다. 웹-셰퍼드는 AI의 웹 탐색 능력을 평가하는 ‘웹리워드벤치’에서 평균 87.6점, 작업 경로 정확도 55%를 기록했습니다. 이는 챗GPT 개발사인 오픈AI의 GPT-4o-미니 모델이 각각 47.5점, 0%를 기록한 것과 비교하면 훨씬 뛰어난 성과입니다. 다른 평가인 ‘웹아레나-라이트’에서도 웹-셰퍼드는 34.55%의 성공률을 보여, GPT-4o-미니보다 10.9%포인트나 더 높은 실력을 뽐냈습니다. 더욱 놀라운 점은 비용입니다. 웹-셰퍼드를 활용하면 기존 방식보다 무려 10배나 저렴한 비용으로 AI의 웹 탐색 능력을 평가하고 향상시킬 수 있습니다. 연구 과정에서 흥미로운 사실도 발견되었는데, AI에게 단계별 체크리스트나 피드백을 제공하지 않으면 웹-셰퍼드의 성능이 크게 떨어졌다고 합니다. 또한, 글자와 이미지를 함께 보여주는 멀티모달 방식이 항상 좋은 것만은 아니었고, 때로는 오히려 AI의 판단을 방해하기도 했습니다.이게 우리 실생활에 무슨 도움이 될까?
웹-셰퍼드 같은 기술의 발전은 앞으로 우리가 AI를 더욱 편리하게 활용할 수 있는 미래를 앞당길 것입니다. AI가 더 저렴한 비용으로 웹 서핑을 잘하게 되면, 개인 비서처럼 온라인 쇼핑을 도와주거나, 복잡한 정보를 대신 찾아주고, 여행 예약까지 알아서 해주는 서비스가 더욱 똑똑해질 수 있습니다. 복잡한 웹사이트 사용에 어려움을 느끼는 사람들에게도 큰 도움이 될 수 있습니다. 연구팀은 웹-셰퍼드의 모델과 코드를 허깅페이스와 깃허브라는 플랫폼에 모두 공개했습니다. 이는 다른 연구자들이나 개발자들이 이 기술을 자유롭게 가져다 쓰고 더 발전시킬 수 있도록 하기 위함입니다. 이런 개방적인 연구 문화는 AI 기술 발전 속도를 더욱 빠르게 만들 것으로 기대됩니다.웹 똑똑이 AI, 기대해도 좋을까?
웹-셰퍼드의 등장은 AI가 웹이라는 복잡한 공간을 얼마나 더 잘 이해하고 활용할 수 있게 될지 보여주는 중요한 신호입니다. 물론 아직 넘어야 할 산은 많지만, 이러한 연구들이 계속된다면 언젠가는 정말 사람처럼 웹을 능숙하게 다루는 AI 비서를 만날 날도 머지않았습니다. 더 똑똑하고 효율적인 AI가 우리의 디지털 생활을 어떻게 바꿔놓을지 기대해봐도 좋을 것 같습니다. 이처럼 연세대와 CMU 연구진이 개발한 웹-셰퍼드는 AI 웹 에이전트 기술의 새로운 가능성을 열었습니다. 앞으로 이 기술이 어떻게 발전하여 우리 생활에 편리함을 더해줄지 주목됩니다. AI가 복잡한 웹 세상을 더 잘 이해하고 우리를 돕는 똑똑한 파트너가 되기를 기대합니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0국내 AI 기술, 글로벌 기업과 경쟁 가능할까?
가능하다
0%
0명이 투표했어요
불가능하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



