“AI 데이터 독점 끝났다?” 위키피디아, 개발자 위해 무료 개방
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.10.01 18:47

기사 3줄 요약
- 1 위키미디어, AI 친화적인 위키데이터 데이터베이스 공개
- 2 1900만개 항목을 벡터로 변환해 AI의 정보 이해도 높여
- 3 빅테크와 소규모 개발자 간의 데이터 격차 해소 기대
위키피디아의 자매 프로젝트인 ‘위키데이터’가 인공지능(AI) 개발자들을 위한 새로운 데이터베이스를 공개했습니다.
거대 기술 기업, 이른바 ‘빅테크’의 데이터 독점 구조에 균열을 낼 수 있다는 분석이 나옵니다. 자금력이 부족한 소규모 개발팀이나 연구자들에게 새로운 기회의 문이 열렸기 때문입니다.
### 그래서, 뭐가 달라지는 건데?
이번에 공개된 데이터베이스는 AI가 정보를 훨씬 쉽게 이해하고 활용할 수 있도록 만들어졌습니다. 기존에는 데이터가 기계가 이해하기 어려운 형태로 저장되어 있어 활용이 까다로웠습니다. 하지만 ‘위키피디아 임베딩 프로젝트’를 거치며 위키데이터에 있는 1900만 개가 넘는 항목들이 ‘벡터’라는 형태로 변환되었습니다. 벡터는 단순히 글자를 나열하는 것을 넘어, 정보들 사이의 관계와 맥락까지 담아내는 방식입니다. 마치 점과 선으로 연결된 똑똑한 지식 지도와 같습니다.### 빅테크랑 싸움이 가능해져?
이 프로젝트의 가장 큰 목표는 AI 개발의 공정한 경쟁 환경을 만드는 것입니다. OpenAI나 구글 같은 빅테크 기업들은 막대한 자본으로 자체적인 데이터베이스를 구축할 수 있습니다. 하지만 소규모 개발팀에게 이는 그림의 떡이었습니다. 위키데이터 포트폴리오 책임자인 리디아 핀처는 “소규모 개발자들에게 최소한의 기회를 주기 위한 것”이라며 프로젝트의 의의를 설명했습니다. 실제로 위키데이터를 활용해 전 세계 공무원들의 연락처를 찾아주는 ‘거브디렉토리’ 같은 공익적 서비스가 탄생하기도 했습니다.### 챗GPT보다 똑똑해질 수도 있다고?
인터넷의 인기 있는 주제만 학습하는 대부분의 AI 챗봇과 달리, 위키데이터는 잘 알려지지 않은 틈새 주제까지 방대하게 다룹니다. 앞으로 개발자들은 이 데이터를 활용해 더 다양하고 깊이 있는 AI를 만들 수 있습니다. 단순히 인터넷 콘텐츠를 긁어모아 AI를 재학습시키는 것보다 훨씬 효율적으로 양질의 정보를 AI에게 가르칠 수 있게 된 것입니다. 이는 AI 시스템이 정보 자체뿐만 아니라 그 배경과 맥락까지 더 깊이 이해하게 돕습니다.### 앞으로의 계획은 뭐야?
이번 프로젝트는 AI 기업 ‘지나 AI’의 모델과 IBM의 자회사 ‘데이터스택스’의 인프라 지원으로 이루어졌습니다. 현재 데이터는 2024년 9월 18일까지의 정보를 기반으로 구축되었습니다. 위키미디어 재단은 먼저 개발자들의 피드백을 받은 후, 최신 정보를 반영해 데이터베이스를 업데이트할 계획입니다. 이번 시도는 AI 기술과 지식의 민주화를 향한 의미 있는 발걸음으로 평가받고 있습니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 데이터 개방, 빅테크 독점 깰 수 있을까?
가능하다
0%
0명이 투표했어요
불가능하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



