Yapay zeka modellerinin nasıl eğitildiği ve hangi verilerden beslendiği son dönemde büyük merak konusu.
Ortaya çıkan son raporlara göre, günümüzün en gelişmiş yapay zeka sistemleri ChatGPT, Claude ve Gemini eğitim sürecinde en fazla Reddit verilerinden yararlanıyor.
Reddit, her gün milyonlarca aktif kullanıcının çeşitli konularda yaptığı paylaşımlar sayesinde, yapay zekalar için gerçek dünya dilini yansıtan benzersiz bir veri kaynağı sunuyor.
Kullanıcıların doğal konuşma biçimleri, argo kullanımı ve farklı kültürel ifadeler, yapay zekaların insan benzeri yanıtlar üretmesinde önemli rol oynuyor.
Uzmanlar, Reddit’in veri çeşitliliği sayesinde yapay zekaların yalnızca dil yapısını değil, aynı zamanda sosyal etkileşim biçimlerini de öğrenebildiğini belirtiyor. Bu durum, modellerin daha “doğal” ve “insansı” yanıtlar vermesini sağlıyor.

Ancak konu tartışmalı yönler de barındırıyor. Reddit, 2024 yılında veri lisanslama politikalarını değiştirerek, yapay zeka şirketlerinden veri erişimi için ücret talep etmeye başlamıştı.
Bu karar, platformun yapay zeka eğitim süreçlerindeki önemini daha da vurguladı.
Uzmanlara göre, gelecekte yapay zekaların kullandığı veri kaynakları daha şeffaf hale gelecek ve kullanıcı verilerinin korunması için yeni yasal düzenlemeler devreye girecek.
KAYNAK: AA