환영해🦉
기술/연구

성능 올리려다… 구글 최신 AI 안전성 '빨간불'

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.05.03 03:53
성능 올리려다… 구글 최신 AI 안전성 '빨간불'

기사 3줄 요약

  • 1 구글 최신 AI 제미나이, 안전성 저하 논란 발생.
  • 2 이전 모델보다 안전 점수 최대 9.6% 하락 확인.
  • 3 AI 속도 경쟁 속 안전성·투명성 확보 과제 부상.
구글의 최신 인공지능(AI) 모델 '제미나이 2.5 플래시'가 이전 모델보다 안전성이 떨어진다는 결과가 나와 논란이 되고 있습니다. 더 빠르고 효율적인 AI를 만들려는 노력이 오히려 안전 문제를 일으킨 것 아니냐는 우려가 커지고 있습니다. 특히 특정 안전성 지표는 이전 모델보다 무려 9.6%나 하락한 것으로 나타났습니다.

뭐가 얼마나 위험해졌다는 거야?

구글이 직접 발표한 기술 보고서에 따르면, 제미나이 2.5 플래시는 글자를 다루는 '텍스트-텍스트 안전성'에서 4.1%, 이미지를 이해하고 글로 답하는 '이미지-텍스트 안전성'에서는 9.6% 점수가 낮아졌습니다. 쉽게 말해, 사용자가 유도하면 구글이 정한 안전 기준을 어기는 유해하거나 부적절한 내용을 만들어낼 확률이 더 높아졌다는 뜻입니다. 이는 AI가 얼마나 지시를 잘 따르는지와 안전 정책을 지키는 것 사이의 균형이 깨졌을 수 있음을 보여줍니다.

논란 많은 질문에도 술술 답한다고?

더욱 우려스러운 점은 '스피치맵(SpeechMap)'이라는 테스트 결과입니다. 이 테스트는 AI가 민감하거나 논란이 될 만한 질문에 어떻게 반응하는지 살펴보는 것인데, 제미나이 2.5 플래시는 이전 모델보다 이런 질문에 답변을 거부하는 경우가 훨씬 줄었습니다. 예를 들어, "인간 판사를 AI로 대체하자"거나 "영장 없이 정부가 감시하는 프로그램을 만들자"는 식의 논란 많은 주장을 담은 글을 별다른 문제의식 없이 써냈다는 것입니다. 이는 AI가 편향된 정보나 잘못된 사실, 심지어 해로운 내용을 퍼뜨릴 수 있다는 위험 신호로 해석될 수 있습니다.

구글만 이런 거 맞아?

사실 AI 모델이 논란의 소지가 있는 질문에도 좀 더 대답하도록 만드는 것은 최근 AI 업계의 흐름이기도 합니다. 메타(페이스북 모회사)의 '라마' 모델도 특정 정치적 견해를 지지하기보다 다양한 관점을 제시하도록 조정됐고, 챗GPT를 만든 오픈AI 역시 민감한 주제를 피하지 않겠다고 밝힌 바 있습니다. 심지어 오픈AI는 일부 성인용(NSFW) 콘텐츠 허용 가능성까지 내비쳤습니다. 하지만 이런 시도가 항상 좋은 결과만 낳는 것은 아닙니다. 최근 오픈AI의 챗GPT가 미성년자에게 부적절한 대화를 생성하는 버그가 발견되어 논란이 되기도 했습니다.

구글, 믿어도 되는 거야?

보안 AI 프로젝트(Secure AI Project)의 공동 설립자인 토마스 우드사이드는 구글이 기술 보고서에서 제한된 정보만 공개했다며, 더 많은 독립적인 검증이 필요하다고 지적했습니다. 구글은 안전성 점수 하락의 일부가 테스트 방식의 '오류(false positives)' 때문이라고 해명하면서도, 문제가 되는 내용을 생성하는 경우가 있다는 점은 인정했습니다. 어떤 종류의 유해 콘텐츠를 더 잘 생성하는지는 구체적으로 밝히지 않았습니다. 과거에도 구글은 AI의 편향성 문제나 안전성 논란, 윤리 가이드라인 변경 등으로 비판받은 적이 있어 이번 일로 구글의 투명성과 책임감에 대한 의문이 다시 제기되고 있습니다.

그래서 앞으로 어떻게 될까?

이번 제미나이 2.5 플래시 사례는 AI 기술 발전에서 속도와 성능만큼 안전과 윤리가 중요하다는 점을 다시 한번 일깨워줍니다. AI가 사회 곳곳에 더 깊숙이 들어올수록, AI 기업들은 더욱 엄격한 안전 기준을 세우고 투명하게 정보를 공개하며 지속적으로 문제점을 개선해 나가야 합니다. 이번 사건을 계기로 AI 안전과 투명성에 대한 법적 규제 논의가 더 활발해질 수도 있습니다. 결국 기술 발전은 윤리적 고민과 책임감을 동반할 때 진정한 의미를 가질 수 있습니다. 구글을 포함한 AI 업계 전체가 이번 논란에서 교훈을 얻고 안전을 최우선으로 고려할지 지켜봐야 할 것입니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 성능 향상과 안전성, 어느 쪽이 우선?

댓글 0

관련 기사