...

Logo Pasino du Havre - Casino-Hôtel - Spa
in partnership with
Logo Nextory

OpenAI araştırdı: Yapay zekanın halüsinasyonları engellenemez mi?

• Sep 18, 2025, 8:07 PM
3 min de lecture
1

ChatGPT'yi geliştiren yapay zeka firması OpenAI'ın yürüttüğü yeni bir araştırma, büyük dil modellerinin neden “halüsinasyon” olarak bilinen uydurma bilgiler ürettiğini açıklığa kavuşturuyor.

Ancak çalışma, halüsinasyonun, kullanıcıya sunulan yapay zekalı sohbet botlarında kalıcı bir sorun olabileceğine işaret ediyor.

Zira bulgular, yapay zekaların yanlış bilgi vermesinin yalnızca eğitim verisindeki hatalardan değil, dil modellerinin yapısından kaynaklandığını ortaya koyuyor. 

Matematiksel açıdan kaçınılmaz

ChatGPT gibi dil modelleri, kullanıcıların sorduğu soru karşısında “Cevabı biliyor muyum?” diye düşünmüyor. Onun yerine, bir cümlede sıradaki kelimeyi tahmin ederek cevap üretiyor.

Örneğin, kullanıcı,“Atatürk hangi yılda doğdu?” diye sorduğunda model bu soruya uygun bir cevap üretmek için “1881” demeli. Ama aslında arka planda yaptığı şey “Bu soruya en uygun sıradaki kelime ne olabilir?” diye hesaplamak. Bazen doğru tahmini yapıyor, bazen de yanlış bir tarih seçiyor.

Sheffield Üniversitesi’nden Doç. Dr. Wei Xing, The Conversation için kaleme aldığı yazısında, "Kelime tahmini üzerine kurulu sistemler, cümle oluştururken hataların birikmesine yol açıyor. Bu nedenle halüsinasyon oranları matematiksel olarak en aza indirilebilse bile tamamen yok edilemiyor," diye yazdı.

"Örneğin, tanınmış kişilerin doğum günleri gibi veriler eğitim setinde yeterince yer almazsa, modeller bu sorularda yüksek oranda yanlış cevap veriyor. Araştırmada, yapay zekaya makale yazarlarından biri olan Adam Kalai’nin doğum günü sorulduğunda, sistem üç farklı ve tamamen hatalı tarih üretmiş."

“Bilmiyorum” demek ceza getiriyor

Araştırmanın dikkat çekici bir diğer bulgusu, mevcut yapay zeka değerlendirme yöntemlerinin sistemi dürüst davranmaya teşvik etmemesi. Google ve OpenAI’ın da kullandığı 10 büyük test seti incelendiğinde, dokuzunda “emin değilim” gibi yanıtların sıfır puanla değerlendirildiği görüldü.

Bu da yapay zekaların “yanlış olsa da bir cevap vermek” yerine “bilmiyorum” demesini ekonomik açıdan mantıksız hale getiriyor. Yani mevcut sistemler, istemeden de olsa tahmin yapmayı ödüllendiriyor.

Çözüm kullanıcı deneyimiyle çatışıyor

OpenAI, yapay zekanın kendi cevaplarına olan güven seviyesini ölçerek buna göre yanıt vermesini öneriyor.

Ancak bu durumda ChatGPT gibi sistemlerin, en az yüzde 30 oranında soruya “bilmiyorum” yanıtı vermesi gerekebilir.

Araştırmaya göre kullanıcılar böyle bir deneyimi tercih etmeyeceği için sistemin cazibesi hızla azalabilir.

Ekonomik engel

Halüsinasyonları azaltmak için güven seviyesi ölçen veya belirsizlikleri azaltmaya çalışan yöntemler uzun zamandır biliniyor. Ancak bu yöntemler çok daha fazla işlem gücü gerektiriyor. Milyonlarca soruyu yanıtlayan tüketici odaklı yapay zekalarda bu maliyet pratikte sürdürülemez hale geliyor.

Buna karşın, tedarik zinciri, finansal işlemler veya tıbbi tanı gibi kritik alanlarda yanlış bilgi maliyeti çok yüksek olduğu için daha pahalı ve belirsizlik odaklı yapay zekaların kullanımı ekonomik açıdan mantıklı hale geliyor.

OpenAI’nin araştırması, tüketiciye dönük yapay zekaların “her soruya yanıt verme” beklentisi ile güvenli ve doğru bilgi sağlama ihtiyacı arasındaki çelişkiye dikkat çekiyor. Donanım gelişmeleri maliyetleri düşürse de, iş modeli değişmediği sürece halüsinasyonların tamamen ortadan kalkması beklenmiyor.


Today

Huntington hastalığına tedavi geliştirildi: Demans yakında sorun olmaktan çıkabilir mi?
• 5:02 PM
6 min
Deneyde uygulanan en yüksek doz, Huntington hastalığının ilerlemesini 3 yıl boyunca yüzde 75 kadar yavaşlattı.
Read the article
ABD, Avrupa otomobillerine uygulanan gümrük vergisini yüzde 15'e çekti
• 4:51 PM
2 min
Otomobillere ilişkin önlemler 1 Ağustos’tan itibaren geriye dönük olarak uygulanacak. Alüminyum ve çeliğe yönelik müzakereler ise henüz yeni başlıyor, bu ürünlere yüzde 50 oranında yüksek vergi uygulanmaya devam ediyor.
Read the article
FDA onayı heyecan ve tartışma yarattı: Leucovorin, otizme çare olur mu?
• 4:28 PM
8 min
Pazartesi günü FDA Komiseri Dr. Marty Makary, kurumun leucovorin’in etiketinde değişiklik yaparak, beyninde folat eksikliği olan çocukların bu ilaca erişimini kolaylaştıracağını açıkladı.
Read the article
Parasetamol, aşılar ve çocuklar: Otizmin sorumlusu anneler mi?
• 2:20 PM
17 min
Tylenol ile otizm arasında bağlantı kuran iddialar, tıp dünyasından siyasete, ailelerden uluslararası kurumlara kadar geniş bir yelpazede yankı buldu.
Read the article
AB'de elektrikli araç satışları artarken, genel otomobil pazarı duraklıyor
• 11:59 AM
3 min
AB'de batarya-elektrikli ve hibrit modeller giderek daha fazla ilgi görürken, dizel ve benzinli araç satışları ivme kaybetmeye devam ediyor.
Read the article
Facebook, yapay zeka destekli flört aracıyla 'kaydırma yorgunluğunu' gidermeyi hedefliyor
• 11:12 AM
2 min
Meta, yeni yapay zeka destekli araçlarının 'aşkı bulmayı kolaylaştırmayı' amaçladığını vurguluyor.
Read the article
Anket: Avrupalı tüketiciler güvenilir, kullanımı kolay ve ücretsiz bir dijital euro istiyor
• 9:40 AM
4 min
AB politika yapıcıları hala dijital euronun yasal çerçevesi üzerinde çalışıyor. Avrupa Merkez Bankası (ECB) dijital euro projesinin en erken 2029 ortalarında hazır olabileceğini söylüyor.
Read the article
Apple, AB rekabet kuralları tarafından haksız yere hedef alındığını iddia ediyor
• 7:18 AM
3 min
ABD'li teknoloji devi, Avrupa Komisyonu tarafından AB'nin Dijital Pazarlar Yasası'nı ihlal ettiği gerekçesiyle nisan ayında 500 milyon euro para cezasına çarptırıldı.
Read the article
Kanserden ölümlerin 25 yıl içinde yaklaşık yüzde 75 artması bekleniyor
• 6:11 AM
3 min
Yeni bir çalışma, yeni kanser vakaları ve ölümlerde beklenen artıştan en çok düşük gelirli ülkelerin etkileneceği uyarısında bulundu.
Read the article