기술/연구

“AI가 AI를 가르친다?” 챗GPT 뛰어넘는 코딩 AI '클로드'

댓글 1 · 저장 0 · 편집: 이도윤 기자 발행: 2025.07.25 07:12

기사 3줄 요약

1 앤트로픽, AI가 AI를 가르치는 방식으로 코딩 AI 최강자 등극
2 '헌법 AI' 원칙으로 코드 평가, 인간 피드백 한계 극복
3 주요 코딩 스타트업들 앤트로픽 '클로드' 채택, 기업가치 100조 육박

최근 실리콘 밸리에서 가장 뜨거운 질문이 있습니다. 바로 “앤트로픽의 AI는 왜 그렇게 코딩을 잘할까?”라는 질문입니다. 이 질문에는 실제로 100조 원이 넘는 가치가 걸려있을지도 모릅니다. 주요 코딩 관련 스타트업들은 앞다투어 앤트로픽의 AI 모델 ‘클로드’를 사용할 정도입니다. 일론 머스크조차 앤트로픽을 이기기 위해 외부 전문가를 고용했다는 소문이 돌 정도입니다. 모두가 궁금해하는 이 비결에 대해 앤트로픽 공동 창립자는 ‘AI가 AI를 평가하는 방식’에 그 답이 있다고 밝혔습니다.

그래서, 걔네 비법이 도대체 뭔데?

앤트로픽의 핵심 비법은 바로 ‘AI 피드백을 통한 강화 학습(RLAIF)’입니다. 쉽게 말해, 사람이 AI가 만든 코드를 평가하는 대신, 다른 ‘선생님 AI’가 평가를 수행하는 방식입니다. 이 선생님 AI는 아무렇게나 평가하지 않습니다. 앤트로픽이 만든 ‘헌법 AI’라는 깐깐한 규칙집을 따릅니다. 이 ‘헌법’에는 ‘코드가 유지 보수하기 쉬운가?’ 또는 ‘사용자가 시키지 않은 불필요한 작업을 하는가?’와 같은 원칙들이 담겨 있습니다. 즉, 단순히 코드를 잘 짜는 것을 넘어, 윤리적이고 효율적인 코드를 만들도록 AI가 또 다른 AI를 훈련시키는 셈입니다. 이런 과정이 수없이 반복되면서 모델의 코딩 실력은 기하급수적으로 향상됩니다.

인간보다 AI 평가가 더 낫다고?

코딩 분야에서는 AI 평가가 인간보다 더 효과적일 수 있습니다. 코드는 일반 글과 달리, 실제로 작동하는지 아닌지로 정답 여부를 명확히 확인할 수 있기 때문입니다. 앤트로픽의 모델은 이런 장치를 내부에 갖추고 스스로 정답을 찾아가도록 설계되었습니다. 또한, 전문성을 갖춘 인간 평가자를 찾는 것은 시간과 비용이 많이 들지만, AI는 지치지 않고 수많은 코드를 일관된 기준으로 평가할 수 있습니다. 이것이 바로 다른 기업들이 쉽게 따라오지 못하는 앤트로픽만의 강력한 무기입니다.

그럼 이제 앤트로픽 천하가 되는건가?

앤트로픽의 성공은 하루아침에 이루어진 것이 아닙니다. 챗GPT의 등장으로 모두가 ‘언어 능력’에 집중할 때, 앤트로픽은 뚝심 있게 ‘코딩’ 능력에 집중했습니다. 수년간의 연구와 노력이 쌓여 지금의 압도적인 기술 격차를 만든 것입니다. 또한, 단순히 코딩만 잘하는 것이 아닙니다. 방대한 프로젝트 파일 속에서 중요한 내용만 쏙쏙 골라 기억하고 활용하는 지능적인 외부 파일 시스템 활용 능력도 갖췄습니다. 이러한 다각적인 노력이 합쳐져 앤트로픽은 코딩 AI 분야의 독보적인 강자로 자리매김했으며, 앞으로의 행보가 더욱 주목됩니다. (사진 출처: 셔터스톡)

편집자: 이도윤 기자

제보·문의: aipick@aipick.kr