"또 베꼈나?" 중국 AI 딥시크, 구글 제미나이 몰래 학습 의혹
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.06.04 02:13

기사 3줄 요약
- 1 중국 AI 딥시크, 구글 제미나이 데이터 무단 사용 의혹 제기
- 2 과거 OpenAI ChatGPT 데이터 활용 이어 유사 논란 재점화
- 3 AI 업계, 데이터 출처 및 윤리 문제로 보안 강화 추세
중국 AI 개발사 딥시크가 또다시 도마 위에 올랐습니다. 최근 공개한 최신 AI 모델 학습 과정에서 구글의 제미나이 데이터를 몰래 가져다 썼다는 의혹이 제기된 것입니다. 이는 마치 옆 반 모범생의 숙제를 몰래 보고 베끼는 것과 유사한 상황으로, AI 업계에 적잖은 파장을 일으키고 있습니다.
정말 제미나이 데이터를 썼을까?
이번 의혹은 호주의 한 개발자가 딥시크의 최신 모델이 구글 제미나이 2.5 프로 모델과 사용하는 단어나 표현 방식이 매우 비슷하다는 점을 지적하면서 시작됐습니다. 또 다른 익명의 개발자 역시 딥시크 모델이 문제 해결을 위해 생성하는 생각의 과정, 즉 '트레이스(traces)'가 제미나이의 것과 유사하다고 주장했습니다. 딥시크가 경쟁사의 AI 모델 데이터를 무단으로 활용했다는 의혹은 이번이 처음이 아닙니다. 과거에도 딥시크의 다른 모델이 OpenAI의 ChatGPT 대화 내용을 학습한 정황이 포착되어 논란이 된 바 있습니다.왜 그런 의혹이 계속 나올까?
전문가들은 이러한 의혹의 배경으로 '데이터 증류(Distillation)'라는 기술을 지목합니다. 데이터 증류란, 이미 잘 만들어진 똑똑한 AI 모델에서 지식을 추출해 자신의 모델을 더 빠르고 효율적으로 학습시키는 방법입니다. AI 연구기관 AI2의 네이선 램버트 연구원은 "딥시크가 그래픽 처리 장치(GPU)는 부족하지만 자금은 풍부한 상황에서, 최고의 AI 모델로부터 합성 데이터를 대량으로 만드는 것이 더 효율적일 수 있다"고 분석했습니다. AI 기술 경쟁이 치열해지면서, 이런 '지름길'의 유혹도 커지는 모양새입니다.AI 업계는 어떻게 대응하고 있나?
인터넷에 AI가 생성한 저품질 정보, 이른바 'AI 슬롭(slop)'이 넘쳐나면서 AI 학습 데이터의 '오염' 문제도 심각해지고 있습니다. 이는 AI 모델의 성능 저하나 예측 불가능성을 야기할 수 있습니다. 이에 OpenAI는 특정 고급 모델 사용 시 신분증 인증을 요구하고 중국 등 일부 국가는 지원 대상에서 제외하는 등 보안 조치를 강화했습니다. 구글 역시 자사 AI 개발 플랫폼에서 모델의 생각 과정을 요약해서 보여주는 방식으로, 앤트로픽도 비슷한 조치를 취하며 기술 유출 방지에 힘쓰고 있습니다. 딥시크의 이번 논란은 AI 기술 발전 이면에 숨겨진 데이터 확보 경쟁과 윤리적 문제를 다시 한번 드러내고 있습니다. AI 모델의 성능만큼이나 학습 데이터의 출처와 활용 방식에 대한 투명성 확보가 중요하다는 목소리가 커지고 있습니다. 논란은 쉽게 가라앉지 않을 것으로 보입니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI 기술 발전 위해 데이터 무단 활용 용인해도 될까?
용인해야
0%
0명이 투표했어요
불가
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



