환영해🦉
기술/연구

메타 AI 위기? '라마4' 실망에 개발자들 뿔났다

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.04.30 00:58
메타 AI 위기? '라마4' 실망에 개발자들 뿔났다

기사 3줄 요약

  • 1 메타 AI '라마4', 성능 부진으로 개발자 실망
  • 2 '매버릭' 모델 벤치마크 논란, 투명성 문제 제기
  • 3 메타, '라마콘' 통해 신뢰 회복 및 반격 예고
페이스북과 인스타그램을 운영하는 메타가 야심차게 내놓은 인공지능(AI) 모델 '라마4(Llama 4)'가 기대 이하의 성적표를 받으면서 개발자들 사이에서 실망감이 커지고 있습니다. 한때 오픈AI의 GPT-4o에 버금간다는 평가까지 받았던 '라마 3.1'의 성공 이후였기에 충격은 더 컸습니다. 메타는 첫 AI 개발자 행사 '라마콘(LlamaCon)'을 통해 이 위기를 정면 돌파하고, 개발자들의 신뢰를 되찾아야 하는 중요한 기로에 섰습니다.

라마4, 뭐가 문제였길래?

라마4의 성능은 여러 AI 능력 평가 시험(벤치마크)에서 경쟁 모델들에 뒤처지는 모습을 보였습니다. 예를 들어, 코딩 능력을 평가하는 'HumanEval' 시험에서 라마4는 75점을 받았지만, 경쟁자인 딥시크(DeepSeek) 모델은 82~85점을 기록했습니다. 문제 해결 능력을 보는 'ARC' 시험과 종합적인 언어 이해도를 측정하는 'MMLU' 시험에서도 각각 오픈AI의 o1 모델과 구글의 제미나이 프로 모델보다 낮은 점수를 받았습니다. 마치 이전 시험에서 전교 1등을 다투던 학생이 다음 시험에서 갑자기 성적이 떨어진 것과 비슷합니다. 기대를 모았던 라마4가 이전 버전만큼의 강력함을 보여주지 못하자, 개발자들은 "이거 뭔가 잘못된 거 아니야?" 하는 의구심을 품기 시작했습니다.

'매버릭' 논란, 믿어도 돼?

설상가상으로 '라마4 매버릭(Llama 4 Maverick)' 모델을 둘러싼 논란이 불거지며 신뢰도에 금이 갔습니다. 메타는 이 모델이 대화 능력이 뛰어나다고 자랑하며 높은 벤치마크 점수를 공개했습니다. 하지만 실제로 개발자들에게 공개된 버전은 벤치마크 테스트 때와 다른 성능을 보였고, 이는 "개발자들을 속인 것 아니냐"는 비판으로 이어졌습니다. 전문가들은 메타가 테스트용 모델과 배포용 모델의 차이점을 명확히 설명했어야 했다고 지적합니다. 이런 투명성 부족은 AI 모델의 성능을 믿고 사용하는 개발자들에게 큰 배신감을 안겨줄 수 있습니다.

똑똑한 AI라더니, 생각은 못 해?

라마4에는 또 다른 아쉬운 점이 있습니다. 바로 스스로 논리적으로 생각하고 문제를 해결하는 'AI 추론(reasoning)' 능력이 특화된 모델이 없다는 것입니다. 오픈AI의 'o1'이나 'o3-mini' 같은 경쟁 모델들은 복잡한 문제 해결이나 과학 연구 분야에서 뛰어난 추론 능력을 보여주고 있습니다. 예를 들어 상식적인 질문에 답하는 능력을 평가하는 'CommonsenseQA' 시험에서 오픈AI의 o1 모델은 85%의 정확도를 보인 반면, 라마4는 72%에 그쳤습니다. 똑똑하긴 한데, 깊이 생각하는 능력은 아직 부족하다는 평가입니다.

그래서 라마콘에서 뭘 보여줄 건데?

결국 메타는 첫 개발자 행사인 라마콘에서 실망한 개발자들의 마음을 돌려야 하는 숙제를 안게 됐습니다. 메타가 신뢰를 회복하기 위해 꺼내 들 카드는 무엇일까요? 아마도 성능을 대폭 개선한 '라마 4.1'이나 '라마 5'를 발표하고, 논란이 된 벤치마크 점수보다 훨씬 뛰어난 실제 성능을 보여주는 것이 급선무일 것입니다. 또한, 부족했던 AI 추론 전용 모델을 새롭게 공개하고, '매버릭 논란' 같은 일이 재발하지 않도록 모델 개발 및 평가 과정을 투명하게 공개하겠다고 약속해야 합니다. 개발자들의 의견을 적극적으로 듣고 반영하는 소통 창구를 마련하는 것도 중요합니다. 메타는 라마4에 여러 전문가 모델이 협력하는 '전문가 혼합(MoE)' 방식을 썼다고 밝혔습니다. 이는 효율성을 높이는 기술이지만, 개발자들이 더 잘 이해하고 활용할 수 있도록 자세한 설명도 필요해 보입니다. 메타가 자랑하는 오픈소스(기술 공개) 전략이 빛을 발하려면, 결국 개발자들이 믿고 쓸 수 있는 강력하고 투명한 AI를 만들어야 합니다. 이번 라마콘이 메타 AI의 미래를 결정짓는 중요한 분수령이 될 전망입니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

메타 AI 신뢰도 회복 가능할까?

댓글 0

관련 기사