...

Logo Yotel Air CDG
in partnership with
Logo Nextory

Yeni yapay zeka modelleri, bilmediklerini itiraf etmektense yanlış cevap verme eğiliminde: Araştırma

• Oct 1, 2024, 7:48 AM
3 min de lecture
1

Yeni bir araştırmaya göre, büyük dil modellerinin (LLM) bir kullanıcının sorusuna yanlış yanıt verme olasılığı, cevabı bilmediğini kabul etme olasılığından daha yüksek ve bu da onları daha az güvenilir yapıyor.

İspanya'daki Universitat Politecnica de Valencia'dan yapay zeka (AI) araştırmacıları, BigScience'ın BLOOM, Meta'nın Llama ve OpenAI'nin GPT'sinin en son sürümlerini, her modele matematik, fen ve coğrafya üzerine binlerce soru sorarak doğruluk açısından test etti.

Araştırmacılar her bir modelin verdiği yanıtların kalitesini karşılaştırdı ve bunları doğru, yanlış ya da kaçıngan yanıtlar olarak sınıflandırdı.

Nature dergisinde yayınlanan çalışmada, her yeni modelle birlikte daha zorlu problemlerde doğru cevapların arttığı görüldü. Yine de modeller, bir soruyu doğru yanıtlayıp yanıtlayamadıkları konusunda daha az şeffaf olma eğilimindeydi.

Daha önceki LLM modelleri cevapları bulamadıklarını ya da bir cevaba ulaşmak için daha fazla bilgiye ihtiyaç duyduklarını belirtirken, yeni modellerin tahmin etme ve kolay sorulara bile yanlış cevaplar üretme olasılığı daha yüksekti.

Temel problemleri çözmede 'belirgin bir gelişme yok'

LLM'ler, veri setlerini anlamak, tahmin etmek ve bunlara dayalı yeni içerikler üretmek için yapay zekayı kullanan derin öğrenme algoritmaları.

Yeni modeller daha karmaşık sorunları daha doğru bir şekilde çözebilirken, çalışmadaki LLM'ler temel soruları yanıtlarken hala bazı hatalar yapıyor.

Araştırmaya göre, "çok düşük zorluk seviyelerinde bile tam güvenilirlik elde edilemiyor."

"Modeller son derece zorlu örnekleri çözebilseler de, çok basit örneklerde de başarısız oluyorlar."

OpenAI'nin GPT-4'ünde de durum böyle; "kaçıngan" cevapların sayısı bir önceki model olan GPT-3.5'e göre önemli ölçüde düştü.

Çalışmanın yazarları, "Bu durum, daha yeni LLM'lerin kendi çalışma aralıkları dışında cevap vermekten daha başarılı bir şekilde kaçınacağı beklentisiyle uyuşmuyor," dedi.

Araştırmacılar daha sonra, teknoloji ölçeklendirilmiş olsa bile modeller için "belirgin bir gelişme olmadığı" sonucuna vardı.


Today

Ukraynalı yetkililer, Rusya'nın Herson şehrindeki bir pazar alanına düzenlediği saldırıda en az yedi kişinin öldüğünü açıkladı
• 11:11 AM
2 min
Ukrayna Cumhurbaşkanı Zelenskiy, kalabalık bir pazar alanına yapılan saldırının görüntülerini paylaşarak benzer saldırıların uluslararası destekle önlenebileceğini vurguladı.
Read the article
Rutte NATO'nun yeni şefi olarak göreve başladı: Ukrayna 'listenin en başında'
• 9:29 AM
3 min
Eski Hollanda Başbakanı Mark Rutte, Salı günü düzenlenen bir törenle NATO Genel Sekreterliği görevini Norveçli Jens Stoltenberg'den resmen devraldı.
Read the article
Brüksel'de havalimanı çalışanları greve gitti, yüzlerce uçuş iptal edildi
• 8:04 AM
3 min
Brüksel'de Zaventem ve Charleroi havalimanlarındaki uçuşlar, yüzlerce güvenlik, temizlik ve ağırlama personelinin daha iyi ücret ve çalışma koşulları için greve gitmesi nedeniyle iptal edildi.
Read the article
Yeni yapay zeka modelleri, bilmediklerini itiraf etmektense yanlış cevap verme eğiliminde: Araştırma
• 7:48 AM
3 min
Yeni bir araştırmaya göre, bir yapay zeka büyük dil modeli (LLM) ne kadar gelişmiş olursa, bir sorguya cevap veremediğini kabul etme ihtimali de o kadar azalıyor.
Read the article
İtalyan futbol dünyası bir süredir 'mafya tipi bir etki' altında
• 6:54 AM
2 min
Pazartesi günü İtalya'da futbol ile bağlantılı mafyatik gruplar oluşturmakla suçlanan 19 kişi gözaltına alındı. Savcılar, bir süredir İtalyan futbol stadyumlarında yürütülen suç faaliyetlerine doğru bir yönelim riski olduğunu vurguluyor.
Read the article
Zelenskiy Almanya'daki toplantı öncesinde yeni bir güvenlik anlaşmasına hazırlanıyor
• 6:06 AM
3 min
Ukrayna Cumhurbaşkanı Volodimir Zelenskiy, ABD ve Ukraynalı yetkililerin Almanya'nın Ramstein kentinde yapılacak 'Ukrayna Savunma Temas Grubu' toplantısına hazırlandığını belirtti.
Read the article