...

Logo Pasino du Havre - Casino-Hôtel - Spa
in partnership with
Logo Nextory

Yeni yapay zeka modelleri, bilmediklerini itiraf etmektense yanlış cevap verme eğiliminde: Araştırma

• Oct 1, 2024, 7:48 AM
3 min de lecture
1

Yeni bir araştırmaya göre, büyük dil modellerinin (LLM) bir kullanıcının sorusuna yanlış yanıt verme olasılığı, cevabı bilmediğini kabul etme olasılığından daha yüksek ve bu da onları daha az güvenilir yapıyor.

İspanya'daki Universitat Politecnica de Valencia'dan yapay zeka (AI) araştırmacıları, BigScience'ın BLOOM, Meta'nın Llama ve OpenAI'nin GPT'sinin en son sürümlerini, her modele matematik, fen ve coğrafya üzerine binlerce soru sorarak doğruluk açısından test etti.

Araştırmacılar her bir modelin verdiği yanıtların kalitesini karşılaştırdı ve bunları doğru, yanlış ya da kaçıngan yanıtlar olarak sınıflandırdı.

Nature dergisinde yayınlanan çalışmada, her yeni modelle birlikte daha zorlu problemlerde doğru cevapların arttığı görüldü. Yine de modeller, bir soruyu doğru yanıtlayıp yanıtlayamadıkları konusunda daha az şeffaf olma eğilimindeydi.

Daha önceki LLM modelleri cevapları bulamadıklarını ya da bir cevaba ulaşmak için daha fazla bilgiye ihtiyaç duyduklarını belirtirken, yeni modellerin tahmin etme ve kolay sorulara bile yanlış cevaplar üretme olasılığı daha yüksekti.

Temel problemleri çözmede 'belirgin bir gelişme yok'

LLM'ler, veri setlerini anlamak, tahmin etmek ve bunlara dayalı yeni içerikler üretmek için yapay zekayı kullanan derin öğrenme algoritmaları.

Yeni modeller daha karmaşık sorunları daha doğru bir şekilde çözebilirken, çalışmadaki LLM'ler temel soruları yanıtlarken hala bazı hatalar yapıyor.

Araştırmaya göre, "çok düşük zorluk seviyelerinde bile tam güvenilirlik elde edilemiyor."

"Modeller son derece zorlu örnekleri çözebilseler de, çok basit örneklerde de başarısız oluyorlar."

OpenAI'nin GPT-4'ünde de durum böyle; "kaçıngan" cevapların sayısı bir önceki model olan GPT-3.5'e göre önemli ölçüde düştü.

Çalışmanın yazarları, "Bu durum, daha yeni LLM'lerin kendi çalışma aralıkları dışında cevap vermekten daha başarılı bir şekilde kaçınacağı beklentisiyle uyuşmuyor," dedi.

Araştırmacılar daha sonra, teknoloji ölçeklendirilmiş olsa bile modeller için "belirgin bir gelişme olmadığı" sonucuna vardı.


Yesterday

Euro Bölgesi işsizlik rakamları son verilere göre sabit kaldı
• 5:40 PM
2 min
İşsizlik oranı haziran, temmuz ve ağustos ayları boyunca yüzde 6,4'te sabit kaldı ve geçen yılın ağustos ayına göre yüzde 0,2 azaldı.
Read the article
Parlak ışık terapisi depresyon hastalarına umut olabilir
• 5:13 PM
1 min
Yeni bir analiz, parlak ışık terapisinin mevsimsel olmayan depresyon hastaları için umut verici bir erken tedavi olduğunu ortaya koydu.
Read the article
Yapay zeka, siber saldırıları daha karmaşık hale getiriyor: Araştırma
• 4:45 PM
6 min
Yeni bir rapor, siber güvenlik ekiplerinin yarısından fazlasının yetersiz finanse edildiklerini belirttiğini ortaya koydu.
Read the article
Aşırı sıcaklarla mücadele için saman ve kil ile çevre dostu evler inşa ediliyor
• 4:19 PM
2 min
Bulgaristan'da bazı mimarlar ve şirketler çevre dostu yapı malzemelerine yöneliyor.
Read the article
TikTok, YouTube, Snapchat'in video önerileri Avrupa Komisyonu tarafından inceleniyor
• 2:06 PM
2 min
Komisyon platformların sahte haberler ve kendine zarar vermeyi teşvik eden içeriklerle beslendiği endişesiyle soruşturma başlattı.
Read the article
Coca-Cola Almanya'da küçülmeye gidiyor: Yüzlerce kişi işten çıkarılacak
• 11:50 AM
3 min
Coca-Cola'nın Almanya'daki 6.500 işçisinden 500'ü ile yol ayrımına gitmesi bekleniyor.
Read the article
Demir Kubbe: İsrail'in hava savunma sistemi nasıl çalışıyor?
• 9:09 AM
7 min
2011'den beri faaliyette olan Demir Kubbe, İsrail'in füzelere karşı ilk savunma hattı. Peki sistem nasıl çalışıyor?
Read the article
Alman süpermarketleri İngiliz rakipleriyle yarışıyor
• 7:51 AM
5 min
Alman perakendeciler Aldi ve Lidl, İngiltere'nin rekabetçi süpermarket sektöründe en iyi performans gösteren rakipleri Tesco, Sainsbury's ve Asda'ya yaklaşıyor.
Read the article
LVMH, Off-White'ı satıyor: Virgil Abloh'un markasının sonu mu geldi?
• 12:29 AM
7 min
Popülerliğinin zirvesindeyken 2021 yılında LVMH tarafından satın alınan Virgil Abloh'un markası Off-White şimdilerde kültürel ilgisizlikle karşı karşıya.
Read the article