“정답지 없이 공부한다?” AI 학습 방식의 비밀, 잘못 배우면 제2의 이루다 사태 터진다
댓글 1
·
저장 0
·
편집: 이도윤 기자
발행: 2025.07.05 17:33

기사 3줄 요약
- 1 AI 학습, '정답지' 유무 따라 지도·비지도 학습으로 구분
- 2 지도 학습은 정답 예측, 비지도 학습은 데이터 속 패턴 발견
- 3 잘못된 데이터 학습 시 구글·이루다 같은 사회적 논란 발생
인공지능(AI)이 스스로 학습하는 방식은 크게 두 가지로 나뉩니다. 마치 학생에게 정답지가 있는 시험지와 없는 시험지를 주는 것과 같습니다. 바로 ‘지도 학습’과 ‘비지도 학습’입니다.
AI에게 어떤 데이터를 주고 어떻게 가르치느냐에 따라 AI의 성능과 행동이 결정됩니다. 만약 잘못된 데이터를 주거나 학습 방식에 문제가 생긴다면, 과거 ‘이루다’ 챗봇 사태처럼 사회적 논란을 일으키는 AI가 탄생할 수도 있습니다.
AI는 어떻게 공부할까? 정답지 유무의 차이
지도 학습(Supervised Learning)은 ‘정답’이 표시된 데이터를 AI에게 주는 방식입니다. 예를 들어 ‘이 사진은 고양이’, ‘저 사진은 개’라고 라벨이 붙은 수많은 사진을 보여주며 학습시킵니다. 이렇게 공부한 AI는 나중에 처음 보는 사진을 보고도 그것이 개인지 고양이인지 높은 정확도로 맞출 수 있습니다. 하지만 이 방식은 데이터 하나하나에 사람이 직접 정답을 붙여야 해서 시간과 비용이 많이 든다는 큰 단점이 있습니다.정답도 없이 알아서? 스스로 배우는 AI
반면 비지도 학습(Unsupervised Learning)은 정답 라벨이 없는 데이터를 AI에게 그냥 던져주는 방식입니다. AI는 데이터의 특징을 스스로 분석해서 비슷한 것끼리 그룹으로 묶습니다. 동물 사진을 주면, 털 모양이나 귀 크기 등을 기준으로 비슷한 사진끼리 분류는 하지만 그 그룹이 ‘고양이’인지 ‘개’인지는 알지 못합니다. 이 방식은 데이터의 숨겨진 패턴이나 구조를 발견하는 데 탁월해, 비슷한 취향의 고객을 묶어 상품을 추천하는 데 널리 사용됩니다.잘못된 공부가 낳은 비극, 그래서 뭐가 중요한데?
현실에서는 정답이 없는 데이터가 훨씬 많기 때문에 비지도 학습의 중요성이 커지고 있습니다. 소량의 정답 데이터와 대량의 비정답 데이터를 섞어 쓰는 ‘준지도 학습’도 해결책으로 떠오릅니다. 하지만 어떤 학습 방식을 쓰든 데이터의 편향은 치명적인 결과를 낳을 수 있습니다. 과거 구글 포토가 흑인을 고릴라로 분류하거나, 챗봇 ‘이루다’가 혐오 발언을 쏟아낸 것도 편향된 데이터 학습 때문이었습니다. 결국 AI 기술의 발전은 어떤 데이터를 어떻게 가르칠지 신중하게 선택하는 우리의 책임에 달려있습니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 1AI의 자율학습, 혁신인가 위험인가?
혁신
0%
0명이 투표했어요
위험
0%
0명이 투표했어요
관련 기사
최신 기사




비지도학습