“클릭 한 번에 쓰레기 논문 와르르?” AI, 학계를 속이는 중!
댓글 1
·
저장 0
·
편집: 이도윤 기자
발행: 2025.05.26 10:17

기사 3줄 요약
- 1 AI 활용 논문 급증, 허위·과장 연구 범람 우려 제기
- 2 미국 건강 데이터 논문, 통계적 검증 미흡 지적
- 3 공공 데이터 AI 연동, 저품질 논문 대량 생산 가능
최근 인공지능(AI)을 이용해 논문을 쓰는 경우가 크게 늘면서, 학계의 신뢰가 흔들리고 있다는 목소리가 커지고 있습니다. 특히 AI가 작성한 것으로 보이는 연구 중에는 잘못되거나 과장된 내용이 많아, 진짜 연구와 가짜 연구를 구분하기 어려워질 수 있다는 우려가 나옵니다. 이는 마치 숙제를 AI에게 맡겼는데, 그 내용이 전부 엉터리인 것과 비슷한 상황입니다.
진짜 AI가 논문 다 써주는 거야?
최근 국제 학술지 ‘플로스 바이올로지’에 실린 연구는 이러한 문제점을 구체적으로 보여줍니다. 연구팀은 미국의 공공 건강 데이터인 ‘국민건강영양조사(NHANES)’ 자료를 바탕으로 쓰인 논문 300편 이상을 분석했습니다. 그 결과, 많은 논문이 단 하나의 단순한 이유로 복잡한 질병을 설명하려 들었고, 통계적으로도 제대로 검증되지 않은 경우가 많았습니다. 연구를 진행한 매트 스픽 박사는 “최근 논문들이 너무나 비슷한 형식으로 작성되고 있어, 마치 AI가 쓴 것처럼 보인다”고 말했습니다. 예를 들어, 비타민 D 수치나 잠의 질 같은 한 가지 요소만으로 우울증이나 심장병 같은 복합적인 질병의 원인이라고 결론 내리는 식입니다. 하지만 실제로는 그 관계가 명확하지 않거나 통계적으로 의미 없는 경우가 대부분이었습니다.클릭 한 번에 논문 뚝딱? 뭐가 문제길래?
연구진이 2014년부터 2024년까지 발표된 NHANES 기반 논문 341편을 자세히 들여다보니, 169개의 서로 다른 변수들이 건강과 관련이 있다고 주장되었습니다. 하지만 이 중 상당수는 서로 연관성이 충돌하거나, 데이터의 특정 부분만 골라서 분석하는 이른바 ‘체리피킹(cherry-picking)’ 방식을 사용한 것으로 드러났습니다. 이는 마치 시험을 보고 나서 맞힌 문제만 골라 제출하는 것과 같습니다. 특히 우울증 관련 논문 28편 중 절반 이상은 다시 검증했을 때 통계적 의미를 잃었습니다. 또한, 많은 논문이 전체 데이터가 아닌 특정 연도나 특정 나이대의 사람들만을 분석 대상으로 삼았으면서도 그 이유를 밝히지 않았습니다. 연구진은 이것이 원하는 결과를 얻기 위해 데이터를 마음대로 편집했거나, 하나의 데이터로 여러 편의 논문을 쓰려는 의도일 수 있다고 지적했습니다.AI 시대, 진짜 연구는 어디로?
이런 문제가 생기는 근본적인 이유는 NHANES 같은 공공 데이터가 AI 시스템에 쉽게 연결될 수 있는 형태로 제공되기 때문입니다. 이로 인해 제대로 된 품질 관리 없이도 논문이 대량으로 생산될 수 있는 환경이 만들어진 것입니다. 실제로 2022년 이후 NHANES 기반 논문 수가 급증했으며, 분석 대상 논문의 절반 이상이 2024년 한 해에 발표되었다고 합니다. 이는 대규모 언어 모델(LLM)이 본격적으로 사용되기 시작한 시기와 일치합니다. 연구에 참여한 찰리 해리슨 박사는 “지금처럼 데이터가 마구잡이로 사용되면, 정말 의미 있는 과학적 발견은 가짜 정보의 소음에 묻혀버릴 것”이라고 경고했습니다. AI 기술의 발전은 분명 유용하지만, 그로 인해 연구의 질이 떨어지고 학문적 신뢰가 무너진다면 심각한 문제가 아닐 수 없습니다. 앞으로 AI를 활용한 연구에 대한 철저한 검증과 윤리적인 접근이 더욱 중요해질 것으로 보입니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 1AI 논문 생성, 학문 발전에 도움인가 해악인가?
도움
0%
0명이 투표했어요
해악
0%
0명이 투표했어요
관련 기사
최신 기사




무한정 찍어 내는 게 문제인 듯;; 이제 석/박사 권위도 실추되려나