Yapay Zeka Asistanlarının Haber Sorularındaki Doğruluk ve Kaynak Gösterme Performansı 14 farklı dilde yürütülen bir araştırma, ChatGPT, Microsoft Copilot, Google Gemini ve Perplexity gibi yapay zeka asistanlarının 3 bin farklı haber sorusuna verdiği yanıtları inceledi. Araştırma sonuçlarına göre, yanıtların %45’inde en az bir ciddi hata, %81’inde ise bir tür sorun tespit edildi. Özellikle, yapay zeka…
14 farklı dilde yürütülen bir araştırma, ChatGPT, Microsoft Copilot, Google Gemini ve Perplexity gibi yapay zeka asistanlarının 3 bin farklı haber sorusuna verdiği yanıtları inceledi. Araştırma sonuçlarına göre, yanıtların %45’inde en az bir ciddi hata, %81’inde ise bir tür sorun tespit edildi. Özellikle, yapay zeka asistanlarının haber kaynaklarını doğru atfetmede zorlandığı ortaya çıktı. Yanıtların üçte birinde eksik, yanıltıcı veya hatalı kaynak gösterimi bulundu. Google’ın Gemini asistanında bu oran %72’ye kadar çıkarken, diğer platformlarda ise %25’in altında kaldı.
Google, Gemini asistanının kullanıcı geri bildirimleriyle sürekli geliştirildiğini belirtirken, OpenAI ve Microsoft yapay zekanın yanlış veya uydurma bilgi üretme sorununu çözmek için çalışmalar yürüttüklerini açıkladılar. Perplexity ise “Derin Araştırma” modunun %93,9 doğruluk oranına sahip olduğunu iddia etti.
Araştırmada, Gemini’nin tek kullanımlık elektronik sigaralarla ilgili bir yasayı yanlış aktardığı, ChatGPT’nin ise Papa Francis’in ölümünden aylar sonra hâlâ görevde olduğunu bildirdiği örnekler yer aldı. Çalışmaya, 18 ülkeden 22 kamu yayın kuruluşu katıldı.
EBU Medya Direktörü Jean Philip De Tender, araştırmanın sonuçlarına ilişkin yaptığı açıklamada, “İnsanlar neye güveneceklerini bilmediklerinde hiçbir şeye güvenmemeye başlıyorlar. Bu da demokratik katılımı caydırabilir.” sözlerine yer verdi. EBU, yapay zeka şirketlerini haberlerle ilgili yanıtlarında daha şeffaf ve hesap verebilir olmaya çağırarak, “Haber kuruluşlarının hataları düzelten süreçleri varsa, aynı sorumluluk yapay zekâ asistanları için de geçerli olmalıdır.” açıklamasında bulundu.
Reklam & İşbirliği: [email protected]