기술/연구

“AI 평가 기준 독점되면 끝장” 천재 개발자들의 반란이 시작됐다

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.11.07 08:34

기사 3줄 요약

1 로드 연구소, AI 공정 평가 위한 '슬링샷' 프로젝트 시작
2 빅테크 기업들의 AI 평가 기준 독점 막기 위한 움직임
3 SWE-Bench 창립자 등 15개 팀 참여, 새 평가 기준 개발

최근 AI 기술의 공정한 평가 기준을 마련하기 위한 의미 있는 움직임이 시작됐습니다. 바로 로드 연구소가 '슬링샷'이라는 이름의 새로운 AI 보조금 지원 프로그램을 발표한 것입니다. 로드 연구소에 따르면 이 프로그램은 AI 연구자들에게 대학에서는 얻기 힘든 자금, 컴퓨팅 파워, 기술 지원 등을 제공합니다. 그 대가로 연구팀은 새로운 스타트업을 만들거나 모든 사람이 쓸 수 있는 오픈소스 코드를 공개하는 등 구체적인 결과물을 내놓아야 합니다.

그래서 AI 평가는 왜 중요한데?

이번에 선정된 첫 15개 프로젝트는 AI 평가라는 어려운 문제에 집중하고 있습니다. AI 평가는 AI가 얼마나 똑똑하고 일을 잘하는지 측정하는 '시험'과 같습니다. 만약 특정 회사만 이 시험 문제를 만들고 채점한다면, 자기 회사 AI에게만 유리한 시험을 만들 수 있어 공정성 문제가 생깁니다. 이번 프로젝트에는 기존 코드의 효율성을 높이는 AI의 능력을 평가하는 '포뮬러 코드', 사무직 AI를 위한 종합 시험인 '비즈벤치' 등이 포함됐습니다. 모두가 공감할 수 있는 객관적인 AI 능력 시험지를 만들려는 시도입니다.

빅테크가 평가 기준 독점하면 안 돼?

유명한 코딩 능력 평가 도구인 'SWE-Bench'의 공동 창립자 존 보다 양도 이번 프로젝트에 참여했습니다. 그는 '코드클래시'라는 새로운 프로젝트를 이끌며 AI의 코딩 실력을 경쟁 방식으로 평가하는 틀을 만들고 있습니다. 그는 “특정 회사들만 자체 기준으로 AI를 평가하는 미래가 올까 봐 조금 걱정된다”고 말했습니다. 이는 소수의 거대 기술 기업(빅테크)이 AI 발전의 방향을 마음대로 휘두를 수 있다는 경고입니다. 심판이 특정 팀의 유니폼을 입고 경기를 뛰게 하는 것과 같습니다.

그럼 슬링샷 프로그램이 해결책이야?

'슬링샷' 프로그램은 학계의 깊이 있는 연구와 기업의 빠른 실행력을 결합한 새로운 방식입니다. 연구자들은 아이디어를 현실로 만들 자원을 얻고, 산업계는 뛰어난 기술과 인재를 더 빨리 만날 수 있게 됩니다. 이러한 노력은 AI 평가 기준을 민주화하고, 소수 기업의 독점을 막는 중요한 기회가 될 수 있습니다. AI 기술이 소수의 강력한 도구가 아닌 모두를 위한 기술로 발전하기 위해서는, 그 가치를 측정하는 '자'부터 공정해야 한다는 목소리가 커지고 있습니다.