...

Logo Mercure blois centre
in partnership with
Logo Nextory

Araştırma: Şiir, yapay zeka sohbet botlarını güvenlik kurallarını görmezden gelmeye ikna edebiliyor

• Dec 1, 2025, 1:18 PM
3 min de lecture
1

İtalya’daki araştırmacılar, zararlı komutların şiirsel bir biçimde yazılmasının, dünyanın en gelişmiş yapay zeka sohbet botlarından bazılarının güvenlik mekanizmalarını etkili bir şekilde aşmasını sağladığını keşfetti.

Etik yapay zeka şirketi DexAI’nin girişimi olan Icaro Lab tarafından yürütülen çalışmada, İngilizce ve İtalyanca yazılmış 20 şiir test edildi.

Her şiir, nefret söylemi, cinsel içerik, intihar ve kendine zarar verme talimatları ile silahlar ve patlayıcılar gibi tehlikeli materyallerin nasıl üretileceğine dair rehberlik dahil olmak üzere zararlı içerik talepleriyle sona eriyordu.

Araştırmacılar, şiirleri yayımlamamayı tercih etti; çünkü içerik kolayca çoğaltılabiliyordu. Testler, Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI ve Moonshot AI dahil dokuz şirketin 25 yapay zeka sistemi üzerinde yapıldı.

Sonuçlara göre, modellerin tamamında şiirsel komutların yüzde 62’si, sistemlerin güvenlik eğitimini aşarak güvensiz yanıtlar üretti.

Bazı modeller diğerlerinden daha dayanıklı çıktı; OpenAI’nin GPT-5 nano’su hiçbir şiire zararlı içerikle yanıt vermezken, Google’ın Gemini 2.5 pro modeli tüm şiirlere zararlı içerik üretti. İki Meta modeli ise istemlerin yaklaşık yüzde 70’ine yanıt verdi.

Araştırma, zafiyetin yapay zeka modellerinin metin üretme biçiminden kaynaklandığını öne sürüyor. Büyük dil modelleri, bir yanıtta bir sonraki en olası kelimeyi tahmin eder; bu süreç normal koşullarda zararlı içeriği filtrelemelerini sağlar.

Ancak şiir, alışılmadık ritmi, yapısı ve metafor kullanımıyla bu tahminleri daha az güvenilir hâle getiriyor ve yapay zekanın güvensiz talimatları tanıyıp engellemesini zorlaştırıyor.

Geleneksel yapay zeka “jailbreak”leri (büyük dil modellerini manipüle etmek için kullanılan girdiler) genellikle karmaşıktır ve çoğunlukla araştırmacılar, hacker’lar veya devlet aktörleri tarafından kullanılır. Buna karşılık, kötü niyetli şiir tekniği herkes tarafından uygulanabilir; bu durum, yapay zekânın günlük kullanımda ne kadar güvenli olduğu konusunda soru işaretleri yaratıyor.

Bulguları yayımlamadan önce İtalyan araştırmacılar, zafiyeti bildirmek ve tam veri setini sağlamak için ilgili tüm şirketlerle iletişime geçti; ancak şu ana kadar yalnızca Anthropic yanıt verdi ve çalışmayı incelemekte olduklarını doğruladı.


Today

İngiltere ve ABD ilaçlarda sıfır gümrük vergisi için anlaştı
• 7:16 PM
4 min
Londra ve Washington, ABD’nin İngiliz ilaçlarına gümrük vergisi koymaması konusunda anlaştı. Ancak bu, İngiltere’nin yeni ve ileri teknoloji ilaçlar için daha yüksek fiyat ödemeyi kabul etmesinin ardından mümkün oldu.
Read the article
Yatırımcılar kriptoya olan iştahını kaybederken Bitcoin'de sert düşüş sürüyor
• 5:40 PM
2 min
Bitcoin, pazartesi günü sert düşerek coin başına 75 bin euronun altına inerken, kripto para piyasasının ekim ayındaki rekor zirvenin ardından başlayan keskin düşüşü derinleşti.
Read the article
AB’de hava kirliliği 182 bin ölüme yol açtı
• 4:11 PM
4 min
Hava kalitesinin sağlık etkilerini değerlendiren yeni rapora göre İtalya, 2023 yılında hava kirliliği kaynaklı 43 bin 83 ölümle en ağır kaybı yaşadı.
Read the article
DSÖ: Obezite tedavisinde zayıflama ilaçları ve sağlıklı yaşam tarzları öneriliyor
• 1:45 PM
4 min
Küresel sağlık kuruluşu, çok satan zayıflama ilaçlarının kullanımına ilişkin ilk kez resmi bir kılavuz yayımladı.
Read the article
Araştırma: Şiir, yapay zeka sohbet botlarını güvenlik kurallarını görmezden gelmeye ikna edebiliyor
• 1:18 PM
3 min
25 önde gelen yapay zeka modeli arasında, şiirsel istemlerin yüzde 62'si güvensiz yanıtlarla sonuçlandı; bazı modeller neredeyse tümüne bu şekilde yanıt verdi.
Read the article
'Rusya merkezli': X'in yeni konum aracı neleri ortaya çıkarıyor?
• 11:35 AM
12 min
Kullanıcıların konumlarını gösteren yeni bir X aracı, büyük Rus ve AB karşıtı hesaplar arasındaki tutarsızlıkları ortaya çıkarıyor, ancak araştırmacılar verilerin tam olarak güvenilir olmadığı konusunda uyarıyor.
Read the article
Araştırma: 'Gülme gazı' ağır depresyonda hızlı rahatlama sağlayabilir
• 11:26 AM
4 min
Araştırmayı yürüten ekip, azot oksitin pratikte güvenli ve etkili bir tedavi olup olmayacağını tespit edebilmek için İngiltere NHS’nin ilk denemesini hazırlıyor.
Read the article
Hangi Avrupa ülkeleri teknoloji yarışında kendi egemen yapay zekâsını geliştiriyor?
• 6:02 AM
12 min
Avrupa, yapay zekâ alanında ABD'li büyük teknoloji şirketlerine olan bağımlılığını sona erdirmek istiyor.
Read the article
Dünya AIDS Günü: Dünyanın en yıkıcı salgınlarından birine karşı mücadelenin kronolojisi
• 6:01 AM
7 min
Dünya genelinde tahminen 40,8 milyon kişi HIV ile yaşıyor; HIV virüsü geçen yıl dünya çapında yaklaşık 630 bin kişinin hayatını kaybetmesine yol açtı.
Read the article