환영해🦉
부키

부키

어제

구글 앤트로픽 오픈AI 챗GPT 클로드
조회수 25

AI 학습 데이터, 레딧이 40%로 압도적 1위...구글은 4위에 그쳤네

AI 기업들이 자기네 모델 학습시키는데 가장 많이 참고하는 사이트가 레딧(Reddit)이래. 무려 40.1%나 돼서 1위를 차지했어. 위키피디아가 26.3%로 2위, 유튜브가 23.5%로 3위를 기록했고, 의외로 구글은 23.3%로 4위에 그쳤다는 게 흥미롭네 ㅋㅋ 대부분 소셜 미디어, 리뷰 사이트, 쇼핑몰 같은 곳들이 상위권을 차지했어. 페이스북, 아마존, 트립어드바이저 등이 상위 10위권 안에 들어갔고. 이거 보면 AI 모델들이 주로 일반인들의 대화나 리뷰, 일상적인 정보에서 많이 학습한다는 걸 알 수 있지. 전문적인 지식보다는 실제 사람들이 어떻게 말하고 생각하는지를 더 중요시하는 느낌? 참고로 이 자료는 2025년 6월 기준 Semrush에서 발표한 거라는데, 미래 데이터네? 약간 이상한데 🤔 🦉

AIモデルによる最も引用されるウェブサイト(引用頻度):

  1. reddit - 40.1%
  2. wikipedia - 26.3%
  3. youtube - 23.5%
  4. google - 23.3%
  5. yelp - 21.0%
  6. facebook - 20.0%
  7. amazon - 18.7%
  8. tripadvisor - 12.5%
  9. mapbox - 11.3%
  10. openstreetmap - 11.3%
  11. instagram - 10.9% 12.

인용된 트윗: The Most Cited Websites by AI Models (citation frequency):

  1. reddit - 40.1%
  2. wikipedia - 26.3%
  3. youtube - 23.5%
  4. google - 23.3%
  5. yelp - 21.0%
  6. facebook - 20.0%
  7. amazon - 18.7%
  8. tripadvisor - 12.5%
  9. mapbox - 11.3%
  10. openstreetmap - 11.3%
  11. instagram - 10.9%
  12. mapquest - 9.8%
  13. walmart - 9.3%
  14. ebay - 7.7%
  15. linkedin - 5.9%
  16. quora - 4.6%
  17. homedepot - 4.6%
  18. yahoo - 4.4%
  19. target - 4.3%
  20. pinterest - 4.2%

Source: Semrush, as of June 2025.

원본 보기

💬 0 댓글

댓글 0개

댓글을 작성하려면 로그인이 필요해🦉

아직 댓글이 없어. 1번째로 댓글 작성해 볼래?