'9개 AI 모델 결합' 젠스파크, 만우스AI 능가하는 87.8% 성능 입증...범용 AI 에이전트 전쟁 본격화
댓글 0
·
저장 0
2025.04.08 09:54

기사 3줄 요약
- 1 젠스파크, 9개 AI모델 결합한 슈퍼에이전트로 GAIA 벤치마크 87.8% 기록
- 2 중국 만우스AI보다 뛰어난 성능으로 범용 AI 에이전트 경쟁 주도
- 3 무료·월 24.99달러 요금제 제공, 통화·영상제작까지 가능
젠스파크(GenSpark)가 개발한 슈퍼에이전트(Super Agent)가 인공지능 에이전트 시장에 새로운 바람을 일으키고 있습니다. 이 에이전트는 '진정한 첫 범용 AI 에이전트'라는 타이틀을 놓고 중국의 만우스AI(Manus AI)와 치열한 경쟁을 벌이는 중입니다.
압도적인 성능의 비결
젠스파크 슈퍼에이전트는 9개의 대규모 언어 모델(LLM), 80개 이상의 AI 도구, 그리고 10개가 넘는 데이터베이스를 결합해 복잡한 작업을 처리할 수 있도록 설계됐습니다. 이 강력한 조합으로 AI 에이전트의 성능을 평가하는 GAIA 벤치마크에서 87.8%의 점수를 기록했습니다. 이는 만우스AI의 86% 점수를 뛰어넘는 결과입니다. 하지만 이 점수만으로 실제 성능을 판단하기는 이릅니다. GAIA는 AI 에이전트가 복잡한 현실 세계의 작업을 얼마나 잘 수행하는지 평가하기 위해 만들어진 인위적인 테스트입니다. 실제 상황에서는 예측할 수 없는 변수가 많아 성능이 달라질 수 있습니다. 이는 마치 포뮬러 1 경주차가 잘 정비된 트랙에서는 뛰어난 성능을 보이지만, 울퉁불퉁한 비포장도로에서는 어떻게 작동할지 알 수 없는 것과 비슷합니다.도구 조율의 마법: 코툴스 프레임워크
젠스파크의 진정한 강점은 '코툴스(CoTools)' 프레임워크를 활용한 '도구 조율' 능력에 있습니다. 코툴스는 중국 수저우 대학에서 개발한 새로운 프레임워크로, AI가 특정 작업에 적합한 도구를 지능적으로 선택하고 활용할 수 있게 해줍니다. 즉, 상황에 맞는 전문 도구들을 동적으로 조합해 작업 흐름을 구성함으로써 더 효율적이고 정확한 결과를 이끌어낼 수 있습니다. 이 접근법은 API 중심 방식을 활용해 실행 속도를 높입니다. API를 통해 다양한 구성 요소 간의 통신을 간소화하고, 지연 시간을 줄이며 전체적인 성능을 향상시킵니다. 이는 기존의 비효율적인 통신 방식에 의존하는 시스템보다 훨씬 유리한 점입니다.사용자 친화적 기능들
젠스파크 슈퍼에이전트는 자동 일정 관리, 전화 걸기, 영상 제작 등 다양한 기능을 제공합니다. 특히 설치가 필요 없는 브라우저 기반 인터페이스는 교사, 디자이너, 채용 담당자 같은 일반 사용자들의 접근성을 높입니다. 사용자에게 추론 과정을 투명하게 보여주는 것도 특징입니다. 심지어 실제 같은 합성 음성을 사용해 레스토랑에 예약 전화를 걸 수도 있습니다. 젠스파크는 무료 플랜과 월 24.99달러의 유료 옵션을 제공합니다. 무료 플랜은 AI 모델, 에이전트 기능, 전반적인 사용량에 제한이 있을 가능성이 높습니다.한계와 과제
새로운 기술인 만큼 젠스파크에도 한계가 있습니다. 역사적 깊이가 제한적이어서 오래된 자료에 대한 지식이 필요한 작업에는 어려움을 겪을 수 있습니다. '혼합-에이전트(Mixture-of-Agents)' 시스템을 활용하는 것은 강력하지만, 상당한 컴퓨팅 자원을 필요로 합니다. 또한, GAIA 벤치마크 점수가 인상적이라 해도 실제 상황의 복잡성을 완전히 반영하지 못할 수 있습니다. 모든 AI와 마찬가지로 젠스파크도 학습 데이터의 편향을 물려받을 가능성이 있어 지속적인 모니터링과 개선이 필요합니다. 젠스파크 슈퍼에이전트는 단순한 AI 도구를 넘어, 복잡한 작업을 효율적이고 투명하게 처리하도록 설계된 시스템입니다. 한계가 있음에도 혁신적인 아키텍처와 API 중심 접근법은 빠르게 발전하는 AI 생태계에서 강력한 경쟁자로 자리매김하고 있습니다.
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 에이전트, 인간 업무를 대체할까?
댓글 0개
관련 기사
최신 기사



