기술/연구

“GPT-5.2 뛰어넘었다?” 앤트로픽 클로드 오퍼스 4.6 성능 저하 의혹

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.14 06:45

기사 3줄 요약

1 앤트로픽 클로드 오퍼스 4.6 모델 전격 출시
2 100만 토큰 지원으로 장기 작업 수행 능력 극대화
3 GPT-5.2 능가하는 성능 불구 최근 너프 의혹 확산

인공지능 시장의 선두 주자인 앤트로픽이 현존하는 모델 중 가장 강력한 성능을 자랑하는 클로드 오퍼스 4.6을 전격 출시했습니다. 새로운 모델은 코딩 능력과 복잡한 문제 해결 능력을 비약적으로 높였으며 인공지능이 스스로 판단하고 실행하는 역량을 극대화했다는 평가를 받습니다. 앤트로픽의 공식 발표에 따르면 이번 모델은 이전 버전보다 더 신중하게 계획을 세우고 장시간 작업을 안정적으로 수행합니다. 특히 대규모 코드 자료에서도 신뢰성 있게 작동하며 스스로 오류를 찾아내 고치는 능력이 크게 향상되었습니다.

100만 토큰이 가져올 무한한 기억력

이번 모델에서 가장 주목할 점은 오퍼스 계열 최초로 100만 토큰의 컨텍스트 창을 지원한다는 사실입니다. 이는 인공지능에게 마치 무한한 기억력을 부여한 것과 비슷한 효과를 냅니다. 사용자는 복잡한 프로젝트 문서 전체를 한 번에 입력할 수 있으며 장기적인 대화 맥락을 놓치지 않고 작업을 이어갈 수 있습니다. 수많은 코드 파일을 넘나드는 어려운 개발 작업도 이제는 한 번의 명령으로 처리가 가능해졌습니다. 이러한 능력 덕분에 클로드 오퍼스 4.6은 단순한 챗봇을 넘어 실제 업무를 대신 수행하는 인공지능 에이전트의 끝판왕으로 불립니다. 리서치나 재무 분석 그리고 복잡한 문서 생성까지 자율적으로 해내는 멀티태스킹 능력을 선보였습니다.

경쟁 모델을 압도하는 놀라운 수치

앤트로픽은 이번 모델이 에이전트 코딩 평가인 터미널 벤치 2.0에서 역대 최고 점수를 기록했다고 밝혔습니다. 복합 추론 테스트에서도 주요 경쟁 모델들을 제치며 기술력을 입증했습니다. 특히 경제적 가치가 있는 지식 작업을 평가하는 지표에서 오픈AI의 GPT-5.2보다 높은 점수를 기록하며 업계를 놀라게 했습니다. 온라인 정보 검색 능력에서도 최고 수준의 성능을 보여주며 실무 활용 가치를 증명했습니다. 성능은 올라갔지만 가격은 기존과 동일하게 유지되어 기업들의 접근성을 높였습니다. 100만 토큰당 입력 비용은 약 7천 원 수준으로 책정되어 대규모 작업을 원하는 사용자들에게 매력적인 선택지가 될 전망입니다.

갑자기 제기된 성능 저하 의혹의 실체

출시 직후 뜨거운 찬사를 받았으나 최근 인공지능 커뮤니티를 중심으로 성능이 나빠졌다는 의혹이 제기되고 있습니다. 일부 사용자들은 출시 초기보다 정확도가 떨어지고 헛소리를 하는 환각 현상이 늘어났다고 주장합니다. 이러한 현상은 경쟁 모델들이 쏟아져 나오는 상황에서 사용자들이 느끼는 심리적 체감일 수 있다는 분석도 나옵니다. 하지만 개발자들 사이에서는 특정 작업의 처리 속도가 느려졌다는 구체적인 제보가 이어지며 논란이 커지는 모양새입니다. 앤트로픽은 이번 모델이 실제 업무 환경에서 더 안정적으로 작동하도록 설계되었다는 점을 강조하고 있습니다. 기술 발전의 속도가 빨라지는 만큼 기대와 현실 사이의 간극을 어떻게 메울지가 향후 과제가 될 것으로 보입니다.