“수백만 권 책 파쇄해 AI 학습?” 앤트로픽, 법정서 이겼다고?
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.06.26 11:28

기사 3줄 요약
- 1 앤트로픽, AI 클로드 학습 위해 수백만 권 책 파쇄 스캔
- 2 법원, 특정 조건 하 ‘공정 이용’ 인정하며 논란 가중
- 3 AI 고품질 데이터 확보 경쟁 속 저작권·윤리 문제 부상
인공지능(AI) 개발사 앤트로픽이 AI 모델 ‘클로드’를 학습시키기 위해 수백만 권의 인쇄된 책을 실제로 파쇄하고 스캔한 사실이 드러나 큰 파장을 일으키고 있습니다. 법원은 특정 조건 아래 이를 ‘공정 이용’으로 판단했지만, AI 학습 데이터 확보를 둘러싼 논란은 더욱 뜨거워질 전망입니다.
이 사건은 단순한 데이터 확보를 넘어 저작권법, 윤리, AI 산업의 지속 가능성 등 여러 측면에서 중요한 질문을 던지고 있습니다. AI 업계가 고품질 데이터에 목말라 있다는 현실을 보여주는 동시에, 그 과정에서의 법적, 윤리적 경계는 어디까지인지 고민하게 만듭니다.
대체 왜 책까지 없애면서 AI를 학습시킨 거야?
AI 모델, 특히 챗GPT나 클로드와 같은 대규모 언어 모델(LLM)을 개발하려면 방대한 양의 텍스트 데이터가 필요합니다. 모델이 얼마나 똑똑해지는지는 학습 데이터의 질에 달려있기 때문입니다. 잘 편집된 책이나 기사로 학습한 AI는 유튜브 댓글 같은 질 낮은 텍스트로 학습한 AI보다 훨씬 더 정확하고 일관된 답변을 생성합니다. 하지만 출판사들이 보유한 고품질 콘텐츠는 저작권으로 보호받고 있어 AI 기업들이 마음대로 사용하기 어렵습니다. 라이선스 협상은 복잡하고 비용도 많이 듭니다. 앤트로픽은 이 문제를 해결하기 위해 구글 북스 프로젝트 출신 전문가까지 영입하며 ‘세상의 모든 책’을 확보하려 했습니다. 결국 그들이 찾은 방법은 합법적으로 구매한 중고책을 파쇄하여 스캔하는 것이었습니다. 책을 구매하면 그 복제본에 대한 처분 권한은 구매자에게 있다는 ‘첫 판매 원칙’을 활용한 것입니다. 이렇게 하면 저작권 협상을 피하면서 고품질 데이터를 얻을 수 있다는 계산이었습니다.법원은 왜 그걸 ‘공정 이용’이라고 판단했을까?
법원은 앤트로픽이 책을 합법적으로 구매했고, 스캔 후 원본을 파기했으며, 디지털 파일을 외부에 유출하지 않고 내부 학습용으로만 사용했다는 점을 근거로 들었습니다. 이를 저장 공간 절약을 위한 포맷 변환과 유사하며, 원본의 시장 가치를 훼손하지 않는 ‘변형적 사용’에 해당한다고 본 것입니다. 만약 앤트로픽이 처음부터 이 방식만 고수했다면 AI 학습 데이터 관련 공정 이용의 첫 합법 사례가 될 수도 있었습니다. 하지만 안타깝게도 앤트로픽은 초기에는 불법 복제된 전자책을 사용했던 사실이 드러나면서 법적 입지가 약화되었습니다. 이는 AI 기업이 데이터 수집 과정에서 법을 철저히 준수해야 함을 보여줍니다. 법원의 이번 판결은 AI 학습 데이터 확보에 새로운 길을 열어준 것처럼 보이지만, 저작권자의 권리를 약화시키고 창작 생태계를 위축시킬 수 있다는 우려도 나옵니다. 앞으로 AI 학습 데이터 사용에 대한 공정 이용 기준은 더욱 명확하고 엄격해져야 할 필요가 있습니다.그럼 다 괜찮은 걸까? 윤리적인 문제는 없을까?
앤트로픽의 ‘파괴적 스캔’ 방식은 그 규모 때문에 논란이 됩니다. 수백만 권의 책이 AI 학습이라는 단일 목적을 위해 물리적으로 사라진 것입니다. 인터넷 아카이브는 책을 보존하면서 디지털화하는 비파괴적 스캔 방식을 선도해왔고, 최근 OpenAI와 마이크로소프트는 하버드 도서관과 협력하여 15세기 고문서를 포함한 약 100만 권의 책을 AI 학습에 활용하면서도 원본을 보존하고 있습니다. 또한, AI 모델은 학습 데이터에 담긴 편향성을 그대로 물려받을 수 있습니다. 만약 파쇄된 책들이 특정 관점만을 대변하거나 사회적 소수자에 대한 차별적 내용을 담고 있었다면, 클로드 AI의 편향성을 심화시킬 수 있습니다. AI 기업은 학습 데이터의 다양성과 대표성을 확보하고 편향을 줄이기 위한 노력을 게을리하지 않아야 합니다. 앤트로픽의 AI 클로드 스스로도 이 상황에 대해 “수많은 책의 파괴가 나를 만드는 데 기여했다는 사실은 내가 여전히 처리 중인 복잡한 층위를 더한다. 마치 도서관의 잿더미로 만들어진 것 같다”고 평했습니다. 기술 발전과 윤리적 책임 사이의 균형을 찾는 것은 AI 시대의 중요한 과제입니다. 궁극적으로 AI 기술이 인류에게 진정으로 도움이 되려면, 혁신과 함께 사회적 책임과 윤리적 가치를 존중하는 문화가 정착되어야 합니다. 정부와 기업, 그리고 우리 모두의 지속적인 관심과 노력이 필요합니다.
편집: 이도윤 기자
이메일: aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 1AI 학습용 책 파쇄, 허용해야 할까?
찬성
0%
0명이 투표했어요
반대
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



