환영해🦉
정책/윤리

충격! AI가 저작권 콘텐츠 '통째로 기억'... 연구팀 발견에 법적 논란 확산

댓글 0 · 저장 0 2025.04.05 21:38
충격! AI가 저작권 콘텐츠 '통째로 기억'... 연구팀 발견에 법적 논란 확산

기사 3줄 요약

  • 1 다국적 연구팀이 AI 모델의 저작권 콘텐츠 기억 현상 발견
  • 2 GPT-4는 특히 전자책 기억 능력 뛰어나 논란 확산
  • 3 OpenAI는 '공정 사용' 주장하며 옵트아웃 옵션 제공
AI 모델들이 저작권이 있는 콘텐츠를 '기억'하고 있다는 충격적인 연구 결과가 나왔습니다. 특히 OpenAI의 모델들이 집중적인 조사를 받고 있어 데이터 투명성과 AI 개발의 윤리적 측면에 관한 중요한 질문들이 제기되고 있습니다. 워싱턴 대학교, 코펜하겐 대학교, 스탠퍼드 대학교 연구진이 공동으로 진행한 연구에서 AI 모델 내 '데이터 각인' 현상의 증거를 발견했습니다. 연구팀은 '높은 의외성' 단어 테스트를 활용해 GPT 모델이 저작권 자료를 포함한 훈련 데이터의 특정 내용을 기억할 수 있음을 증명했습니다. 이 방법은 텍스트 내에서 흔하지 않은 단어를 식별하여 기억 현상을 감지합니다. 이번 연구는 뉴욕타임스 같은 출처의 소설과 기사에 초점을 맞췄는데, GPT-4가 특히 BookMIA 데이터셋의 저작권이 있는 전자책을 기억하는 놀라운 능력을 보여줬습니다. 이로 인해 연구자들은 이러한 고급 AI 시스템을 훈련시키는 데 사용된 데이터에 대한 더 큰 투명성을 요구하고 있으며, 과학적으로 조사하고 감사할 수 있는 모델의 필요성을 강조했습니다. OpenAI는 '공정 사용' 원칙을 내세워 자사의 관행을 방어하고 있습니다. 공개적으로 이용 가능한 인터넷 자료로 AI 모델을 훈련시키는 것이 확립된 저작권 예외와 일치한다고 주장하고 있죠. 동시에 회사는 콘텐츠 소유자들에게 자신의 자료가 향후 훈련 데이터셋에 사용되지 않도록 하는 옵트아웃(제외 신청) 메커니즘을 제공하고 있습니다. 하지만 이 옵트아웃 메커니즘의 구체적인 절차와 한계는 여전히 불분명한 상태입니다. AI 저작권, 데이터 사용, 윤리적 고려사항에 관한 논쟁은 AI 기술이 발전함에 따라 계속 진화하고 있으며, 혁신과 지적 재산권 사이의 균형을 맞추는 과정에 있습니다. AI 훈련 데이터를 둘러싼 법적 환경이 계속 발전함에 따라, 기억 현상과 데이터 각인의 영향은 여전히 주요 관심사로 남아 있습니다.
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI가 저작권 콘텐츠 기억, 합법적인가?

댓글 0

관련 기사

최신 기사

사용자 피드백