ChatGPT ve diğer büyük dil modelleri (LLM’ler), cevap üretirken en çok Reddit verilerini kullanıyor. Statista’nın araştırmasına göre, 2025’in ilk çeyreğinde yapay zekalar, alıntılarının yüzde 40’ını Reddit’ten yaparken, Wikipedia yüzde 26,3 ile ikinci sırada yer aldı.
Uzmanlar, Reddit’in gerçek kullanıcı tartışmalarını içermesinin, LLM geliştiricilerinin resmi bilgilerden çok doğal dil verilerini önceliklendirdiğini gösterdiğini belirtiyor. Diğer kaynaklar arasında YouTube, Google, Yelp, Facebook, Amazon ve Tripadvisor öne çıkıyor.
Ayrıca sosyal medya platformları ile yapay zeka üreticileri arasında veri anlaşmaları yapılıyor. 2024’te Google ile Reddit arasında yapılan anlaşmaya göre, Google yapay zekalarını Reddit verileriyle beslemek için yıllık 60 milyon dolar ödüyor. OpenAI de ChatGPT için Reddit ile veri paylaşımı anlaşması yaptı.
