기술/연구

“AI 헛소리 원인은 ‘뇌 회로’ 오류” 메타가 수정 기술 공개

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.11.01 15:44

기사 3줄 요약

1 메타, AI 추론 오류 실시간 탐지 및 수정 기술 개발
2 AI 내부 연산 회로 직접 분석해 오류 원인 찾아내
3 AI 신뢰도 높이는 ‘AI 디버깅’ 시대 열어

인공지능(AI)이 가끔씩 이상한 말을 하는 이유를 드디어 찾아냈습니다. 페이스북의 부모 회사인 메타가 AI의 생각 속으로 들어가 오류를 실시간으로 찾아내고 고치는 새로운 기술을 개발했습니다. 마치 의사가 사람의 뇌를 직접 들여다보고 문제를 치료하는 것과 같은 획기적인 방식입니다.

예전엔 AI 속을 어떻게 들여다봤는데?

기존에는 AI가 왜 틀렸는지 정확히 알기 어려웠습니다. AI가 내놓은 최종 결과물만 보고 추측할 뿐, 생각하는 과정 자체를 볼 수는 없었기 때문입니다. 이것을 ‘블랙박스’ 방식이라고 부릅니다. 고장 난 TV를 열어보지도 않고 겉모습만 보고 원인을 맞히려 하는 것과 같아서, 문제의 근본적인 원인을 해결하기는 힘들었습니다.

메타의 새로운 기술은 뭐가 달라?

메타 AI 연구소와 에든버러대학교 연구진이 발표한 ‘회로 기반 추론 검증(CRV)’ 기술은 완전히 다릅니다. 이 기술은 AI의 생각하는 과정을 ‘연산 회로’ 단위로 시각화해서 마치 지도처럼 보여줍니다. 연구진은 ‘라마 3.1 8B 인스트럭트’라는 AI 모델 내부에 ‘트랜스코더’라는 특별한 모듈을 넣었습니다. 이 모듈 덕분에 AI의 복잡한 계산 과정을 사람이 쉽게 이해할 수 있는 신호로 바꿔서 볼 수 있게 됐습니다. 이것은 AI의 머릿속을 훤히 들여다보는 ‘화이트박스’ 접근법입니다. AI가 어떤 생각의 경로를 거치다가 잘못된 길로 빠졌는지 정확히 찾아낼 수 있습니다.

그래서, 진짜로 오류를 고쳤어?

실제로 놀라운 결과가 있었습니다. 한 실험에서 AI가 수학 문제를 풀다가 곱셈을 엉뚱한 순서에 적용하는 실수를 저질렀습니다. 연구진은 CRV 기술로 잘못 활성화된 ‘곱셈 회로’를 찾아냈습니다. 그리고 이 회로의 작동을 잠시 억제하자, AI는 곧바로 올바른 계산 경로로 돌아와 문제를 완벽하게 풀어냈습니다.

이게 왜 그렇게 중요해?

이번 연구는 ‘AI 디버깅’이라는 새로운 길을 열었습니다. 이제 개발자들은 AI가 실수하는 근본적인 원인을 빠르게 찾아내 고칠 수 있게 됩니다. 이는 AI의 신뢰성을 크게 높여, 의료나 금융처럼 아주 중요한 분야에서도 AI를 안심하고 사용할 수 있는 기반이 됩니다. 또한, AI가 문제 유형에 따라 서로 다른 내부 회로, 즉 다른 생각 방식을 사용한다는 사실을 실제로 증명해 낸 의미있는 발견이기도 합니다.