AI, 이제 출처까지 밝힌다? 가짜뉴스 시대 끝날까
댓글 0
·
저장 0
2025.04.25 07:05

기사 3줄 요약
- 1 AI 스타트업 플레이아스, 새 소형 모델 공개.
- 2 자동 인용 기능 탑재, 정보 출처 명확히 밝힘.
- 3 유럽 언어 지원 및 윤리적 훈련 강조함.
AI가 쓴 글, 어디까지 믿어야 할까요? 출처 없는 정보에 골치 아팠다면 주목해야 합니다. 이제 AI가 직접 "이 정보는 여기서 가져왔어요"라고 알려주는 시대가 열릴지도 모릅니다. AI 스타트업 '플레이아스(Pleias)'가 바로 그런 똑똑하고 정직한 AI 모델들을 선보였습니다.
이 모델들은 단순히 정보를 나열하는 것을 넘어, 그 정보가 어디서 왔는지 '출처'를 자동으로 착착 붙여주는 기능을 갖췄습니다. 마치 우리가 리포트 쓸 때 참고 문헌 적는 것처럼 말이죠. 덕분에 AI가 마음대로 이야기를 지어내는 '환각 현상'을 줄이고, 정보의 신뢰도를 크게 높일 수 있습니다.
특히 주목할 점은 '다국어 능력'입니다. 영어 중심이던 기존 AI 모델과 달리, 플레이아스 모델들은 프랑스어, 독일어, 스페인어 등 주요 유럽 언어를 영어만큼 능숙하게 처리합니다. 유럽처럼 다양한 언어를 쓰는 지역에서 AI를 활용하기 훨씬 쉬워진 것입니다.
AI가 출처를 밝힌다고? 이게 왜 중요해?
최근 AI 챗봇에게 질문하면 그럴듯하지만 사실이 아닌 답변을 내놓는 경우가 많아 문제가 됐습니다. 이를 '환각(Hallucination)'이라고 부르는데, AI가 학습한 방대한 데이터 속에서 정보를 잘못 연결하거나 없는 내용을 만들어내기 때문입니다. 플레이아스의 새 모델은 '검색 증강 생성(RAG)'이라는 기술에 특화되어 있습니다. RAG는 AI가 답변을 생성할 때, 관련된 최신 정보를 외부 데이터베이스에서 실시간으로 찾아 참고하는 방식입니다. 여기에 플레이아스는 '자동 인용' 기능을 더했습니다. AI가 답변의 근거가 된 자료 출처를 명확히 제시하니, 사용자는 정보가 진짜인지 쉽게 확인할 수 있고 AI는 뻥(?)을 덜 치게 되는 셈입니다.어떤 모델들이 나왔는데?
플레이아스는 사용 환경과 목적에 맞게 골라 쓸 수 있도록 여러 크기의 모델을 내놓았습니다. 마치 컴퓨터 살 때 사양 고르는 것과 비슷합니다. * 플레이아스 피코(Pico): 3억 5천만 개의 파라미터(AI의 똑똑함을 나타내는 단위 중 하나)를 가진 가장 작은 모델입니다. 스마트폰 같은 저사양 기기에서도 잘 돌아가도록 설계됐습니다. 여러 유럽 언어를 지원하며 비용 효율이 높습니다. * 플레이아스 나노(Nano): 12억 개 파라미터로, 피코보다 좀 더 똑똑합니다. 정보 출처를 더 꼼꼼히 분석하고 검증하는 능력이 강화됐습니다. 유럽 연합(EU)의 AI 법 같은 규제 기준도 만족시켜 기업에서 안심하고 쓸 수 있습니다. * 플레이아스 1.0 패밀리: 피코, 나노를 포함해 30억 개 파라미터 모델까지 포함하는 제품군입니다. 모두 오픈소스로 공개되어 있고 EU AI 법을 준수합니다. 특히 여러 언어로 정보를 찾고 답변하는 데 강점을 보입니다. 아래 표는 각 모델의 주요 특징을 정리한 것입니다.모델 | 파라미터 수 | 다국어 지원 | 주요 특징 | 주요 용도 |
---|---|---|---|---|
플레이아스 피코 | 3.5억 개 | 주요 유럽 언어 | 비용 효율적, 구조화된 출처 종합 | 모바일 앱, 저사양 환경 |
플레이아스 나노 | 12억 개 | 주요 유럽 언어 | 향상된 검증 가능성, 출처 분석 | 기업용 앱, 규제 준수 중요 환경 |
플레이아스 1.0 패밀리 | 3.5억, 12억, 30억 개 | 주요 유럽 언어 | 오픈소스, EU AI 법 준수 | 다양한 앱, 다국어 정보 검색/생성 |
그래서 진짜 성능은 좋아?
플레이아스는 자신들의 모델이 작지만 강력하다고 말합니다. 실제로 여러 성능 평가(벤치마크)에서 비슷한 크기의 다른 AI 모델들은 물론, 훨씬 덩치가 큰 유명 모델(라마 3.1, 큐원 2.5 등)보다 특정 작업에서 더 뛰어난 결과를 보였다고 밝혔습니다. 예를 들어, 여러 문서에 흩어진 정보를 종합해 답을 찾아야 하는 복잡한 질문에서 더 정확한 답변을 내놓았다는 것입니다. 이런 성능의 비결은 똑똑한 학습 방식에 있습니다. 실제 RAG 작업 환경과 유사하게 만들어진 방대한 가상 데이터를 학습했고, 질문의 의도를 파악하고, 관련 정보를 찾아 순위를 매기는 등 RAG 작업에 필요한 여러 기능을 모델 자체에 통합했습니다. 단순히 정보를 외우는 게 아니라, 정보를 찾고 분석해서 답을 만드는 과정을 더 잘하도록 훈련된 것입니다. 개발자들이 이 모델을 쉽게 가져다 쓸 수 있도록 'RagSystem'이라는 라이브러리도 제공합니다. 몇 줄의 코드만으로 문서 검색, 정보 추출, 답변 생성 기능을 구현할 수 있습니다.윤리적인 AI라고? 뭐가 다른데?
플레이아스는 AI 개발에서 '윤리'를 강조합니다. AI 학습에 사용한 데이터를 신중하게 검증된 출처에서만 가져왔고, 인터넷 전체 데이터를 무분별하게 긁어모으는 방식(CommonCrawl 사용 배제)을 피했습니다. 또한, 학습 데이터에서 유해하거나 편향된 내용이 없는지 자동으로 걸러내는 필터링 과정을 거쳤다고 합니다. 물론 완벽할 수는 없습니다. 플레이아스 스스로도 자신들의 모델이 추가적인 안전 장치 튜닝은 거치지 않았기 때문에 여전히 부적절한 내용을 생성할 가능성이 있다고 인정합니다. 또한 모델이 처리할 수 있는 정보의 길이에 한계가 있고, 검색 기능을 모델에 완전히 통합하는 것은 앞으로의 과제라고 밝혔습니다. 하지만 플레이아스의 이번 출시는 AI가 더 강력해지는 것만큼이나 더 투명하고 책임감 있게 발전해야 한다는 중요한 메시지를 던집니다. 정보의 출처를 밝히는 작은 변화가 AI에 대한 신뢰를 쌓는 큰 걸음이 될 수 있습니다. 앞으로 AI는 무조건 크고 강력한 것보다, 더 똑똑하고 믿을 수 있는 방향으로 나아갈 것으로 보입니다.
부키와 모키의 티격태격
찬/반 투표
총 투표수: 0AI의 출처 표시, 가짜뉴스 방지에 효과적일까?
댓글 0개
관련 기사
최신 기사



