“저작권 문제없다고?” AI 학습 데이터, ‘오픈’ 딱지 믿다간 소송각!
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.06.12 23:26

기사 3줄 요약
- 1 AI 학습 데이터, '오픈'이라도 저작권 함정 존재
- 2 CC라이선스 조건 위반, 저작인격권 침해 등 우려
- 3 AI 개발, 데이터 저작권 문제 신중히 살펴야
AI 시대, 데이터가 석유보다 귀하다지만, 그 '석유' 잘못 썼다간 법적 분쟁에 휘말릴 수 있습니다. 특히 ‘공짜’나 ‘오픈’이라는 이름표가 붙은 AI 학습용 데이터라고 해서 마냥 안심할 수는 없습니다. 미국의 AI 저작권 전문가 마이클 웨인버그는 "쉬운 일도 어렵다"고 지적하며, 공개된 자료로 만든 데이터셋조차 저작권 문제에서 자유롭지 않다고 경고합니다.
많은 사람들이 '오픈 라이선스'라고 하면 저작권 걱정 없이 마음껏 써도 된다고 생각하기 쉽지만, 현실은 그렇지 않습니다. 웨인버그는 미국의 한 연구기관이 만든 '커먼 파일(Common Pile)'이라는 AI 학습용 데이터 꾸러미를 예로 들며, 이것이 마치 저작권 문제없는 만능 해결책처럼 여겨지는 것을 우려합니다. 하지만 ‘오픈 라이선스’라는 말 뒤에는 우리가 놓치기 쉬운 여러 함정이 숨어있습니다.
오픈 라이선스, 그게 다 공짜라는 뜻이야?
오픈 라이선스 중 가장 유명한 크리에이티브 커먼즈 라이선스(CCL)만 해도 종류가 다양합니다. 어떤 라이선스는 만든 사람 이름만 밝히면 상업적으로도 쓸 수 있지만(CC BY), 어떤 것은 비영리 목적으로만 사용해야 하고(CC BY-NC), 내용을 바꾸면 안 되는 조건도 있습니다. 만약 AI 학습에 사용된 데이터가 '비영리' 조건이었는데, 그 AI로 돈을 벌면 라이선스 위반이 될 수 있습니다. 수백만, 수천만 건의 데이터를 AI에게 학습시킬 때, 각각의 데이터 출처를 일일이 밝히는 것도 현실적으로 매우 어렵습니다. 이는 마치 도서관 전체 책의 모든 저자를 책 첫 페이지에 다 적으라는 것과 비슷한 상황입니다. 이런 복잡함 때문에 '오픈 라이선스'라는 이름만 믿고 데이터를 사용하다가는 예상치 못한 법적 문제에 부딪힐 수 있습니다.내 글이 AI 맘대로 바뀐다고? 저작인격권은?
저작권에는 돈과 관련된 재산적 권리 외에 창작자의 인격적 권리, 즉 '저작인격권'이라는 것도 있습니다. 이는 자신의 창작물을 공개할지 말지 결정할 권리, 자신의 이름을 표시할 권리, 그리고 창작물의 내용이 함부로 바뀌거나 왜곡되지 않을 권리를 포함합니다. AI가 학습 과정에서 원본 글의 의미를 왜곡하거나, 작가의 의도와 다르게 내용을 변경한다면 저작인격권 침해 문제가 생길 수 있습니다. 또한, AI가 학습한 내용을 바탕으로 새로운 글이나 그림을 만들었을 때, 이것이 원본과 너무 비슷하다면 '2차적 저작물'로 인한 저작권 침해 논란도 발생할 수 있습니다. 예를 들어 특정 작가의 글 스타일을 그대로 베껴 쓴 듯한 AI 생성물이 나온다면, 원작자는 자신의 권리가 침해되었다고 느낄 수 있습니다. 아직 AI 생성물의 저작권 문제는 명확한 법적 기준이 부족한 실정입니다.그럼 뭘 믿고 써야 해? 복잡한 데이터의 세계
미국 저작권법에는 '공정 이용(Fair Use)'이라는 개념이 있어서, 특정 조건에서는 저작권자의 허락 없이도 저작물을 사용할 수 있게 합니다. 하지만 AI 학습이 여기에 해당하는지는 여전히 논쟁거리이며, 법원의 판단도 각 사안마다 다를 수 있습니다. 특히 상업적 목적으로 AI를 개발한다면 공정 이용을 인정받기 더욱 어려워질 수 있습니다. 인터넷에서 데이터를 긁어 모으는 '웹 스크래핑' 역시 웹사이트 이용 약관 위반이나 개인정보보호법 위반 문제를 일으킬 수 있습니다. 게다가, 특정 그룹에 편향된 데이터로 AI를 학습시키면, 그 AI는 차별적인 결과를 내놓아 사회적 문제를 일으킬 수도 있습니다. 이런 상황이라면 AI 개발자는 물론, AI 서비스를 이용하는 우리도 안심할 수만은 없습니다. 결국 AI 개발은 단순히 기술의 문제가 아니라, 법적, 윤리적 고민이 함께 필요한 복잡한 과제입니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0오픈 라이선스 데이터, AI 학습에 자유롭게 써도 될까?
댓글 0개
관련 기사
최신 기사



