Doktor yerine yapay zeka mı? Yeni araştırma büyük tehlikeyi gözler önüne serdi

Yapay zekâ tabanlı sohbet botlarının sağlık alanında verdiği yanıtların önemli bir bölümünün hatalı ya da yanıltıcı olabileceği ortaya kondu. ChatGPT, Gemini, Grok, Meta AI ve DeepSeek gibi yaygın kullanılan platformlar üzerinde yapılan yeni bir araştırma, bu sistemlerin tıbbi konularda güvenilirlik sorunu yaşayabildiğini gösterdi.
BMJ Open dergisinde yayımlanan çalışmada araştırmacılar, beş farklı yapay zekâ modeline kanser, aşılar, kök hücre tedavileri, beslenme ve spor performansı gibi alanlarda 50 farklı soru yöneltti. Uzman değerlendirmelerine göre yanıtların yüzde 20’si “yüksek derecede sorunlu”, yüzde 50’si “sorunlu” ve yüzde 30’u ise “kısmen sorunlu” olarak sınıflandırıldı.
Bu sonuçlar, verilen cevapların yaklaşık yarısının ciddi düzeyde hata veya eksik bilgi içerdiğine işaret etti.

Kaynaklar güvenilir değil
Araştırmada dikkat çeken bir diğer bulgu ise yapay zekâların sunduğu kaynakların güvenilir olmaması oldu. Botların çoğunun yanlış yazar isimleri, geçersiz bağlantılar veya tamamen uydurma akademik referanslar verdiği tespit edildi. Bu durum, verilen bilgilerin doğruluğunu kontrol etmeyi zorlaştırdı.
Platformlar arasında en yüksek hata oranı yüzde 58 ile Grok’ta görülürken, ChatGPT yüzde 52, Meta AI ise yüzde 50 hata oranıyla takip etti.
Açık uçlu sorular daha riskli
Çalışmaya göre yapay zekâlar “evet-hayır” gibi kapalı uçlu sorularda daha tutarlı sonuçlar verirken, kullanıcıların günlük hayatta sıkça sorduğu açık uçlu sorularda hata oranı belirgin şekilde arttı. Açık uçlu sorularda “yüksek derecede sorunlu” yanıt oranı yüzde 32 olarak kaydedildi.
Reklam
Uzmanlar, dil modellerinin gerçek bilgiye sahip sistemler olmadığını, yalnızca büyük veri setlerindeki istatistiksel örüntülere dayanarak tahmin yaptığını vurguladı. Eğitim verilerinde bilimsel kaynakların yanı sıra sosyal medya ve forum içeriklerinin de bulunması, yanlış bilgilerin ortaya çıkmasına zemin hazırlıyor.

Kullanıcılar için yanıltıcı sonuçlar
Nature Medicine dergisinde yayımlanan ayrı bir çalışma ise dikkat çekici bir sonuç ortaya koydu. Yapay zekâ sistemleri tıbbi soruları bağımsız şekilde yüzde 95 doğrulukla yanıtlayabilirken, gerçek kullanıcıların bu araçları kullanması durumunda doğru bilgiye ulaşma oranının yüzde 35’e kadar düştüğü belirlendi.
Uzmanlardan uyarı
Bilim adamları, yapay zekânın özellikle karmaşık bilgileri özetleme veya doktora sorulacak soruları hazırlama gibi alanlarda yardımcı olabileceğini, ancak tek başına tıbbi otorite olarak görülmemesi gerektiğini vurguladı. Kullanıcıların, yapay zekâdan elde ettikleri sağlık bilgilerinin mutlaka güvenilir kaynaklarla doğrulanması gerektiği ifade edildi.

Sitemizde paylaştığınız yorumlar, diğer kullanıcılar için değerli bir kaynaktır. Lütfen farklı görüşlere ve diğer kullanıcılara saygılı olun. Kaba, saldırgan, aşağılayıcı veya ayrımcı ifadeler kullanmaktan kaçının.