...

Logo Pasino du Havre - Casino-Hôtel - Spa
in partnership with
Logo Nextory

Araştırma: Çoğu insan yapay zeka ve insan sesleri arasındaki farkı anlayamıyor

• Oct 12, 2025, 10:47 AM
10 min de lecture
1

Yapay zeka (AI), birçok kişi için artık günlük yaşamın doğal bir parçası haline geldi. Sosyal medya akışlarımızda onunla yazışıyor, büyük dil modelleri aracılığıyla sohbet ediyor ve Amazon’un Alexa’sı her komutla yanıt verdiğinde sesini duyuyoruz. Ancak teknoloji bu kadar hızlı gelişirken, gerçeği sahteden ayırt etmek giderek zorlaşıyor.

PLoS One dergisinde yayımlanan yeni bir araştırma, insanların artık yapay zeka tarafından üretilen seslerle gerçek insan sesleri arasında farkı ayırt etmekte zorlandığını ortaya koydu.

Katılımcılara, yarısı yapay zeka tarafından üretilmiş, diğer yarısı ise gerçek insanlara ait 80 farklı ses örneği dinletildi. Ardından, bu sesleri güvenilirlik ve baskınlık düzeylerine göre değerlendirmeleri istendi.

Yapay zeka kategorisinde iki tür ses kullanıldı: tamamen sıfırdan oluşturulan jenerik sesler ve gerçek insanların konuşmalarından klonlanan sesler.

Katılımcıların çoğu jenerik AI seslerinin sahte olduğunu anlayabildi ancak sentetik olarak klonlanmış sesler çok daha inandırıcı bulundu ve örneklerin yüzde 58’i gerçek sanıldı. Buna karşılık, gerçek insan seslerinin yüzde 62’si doğru şekilde tanımlandı. Sonuç olarak, iki tür sesi ayırt etme becerisi arasında yalnızca küçük bir fark kaldı.

Araştırmanın başyazarı ve Londra Queen Mary Üniversitesi’nde psikoloji alanında kıdemli öğretim görevlisi olan Dr. Nadine Lavan, Euronews Next’e yaptığı açıklamada şunları söyledi: “Bu araştırmanın en dikkat çekici yönü, yapay zeka tarafından üretilen seslerin —özellikle ses klonlarının— gerçek insan kayıtları kadar doğal duyulmasıdır.”

Dr. Lavan, “Üstelik bu kadar gerçekçi sesler yaratmak için kimsenin yüksek ücretli yazılımlara, özel programlama bilgisine veya ileri teknolojik becerilere ihtiyacı yok. Herkesin erişebileceği ticari araçlarla bu mümkün hale geldi,” diye ekledi.

Endişeleri dile getirmek

Yapay zeka ses klonlama teknolojisi, bir kişinin ses verilerini analiz ederek temel özelliklerini çıkarır ve bu özellikleri kullanarak sesi yüksek doğrulukla yeniden üretir. Bu hassas taklit yeteneği, teknolojiyi yalnızca yaratıcı alanlarda değil, aynı zamanda kötüye kullanım açısından da dikkat çekici hale getirdi. Özellikle bazı dolandırıcılar, insanların sosyal medya paylaşımlarındaki ses kayıtlarını kullanarak sevdiklerinin seslerini taklit edebiliyor ve bu yöntemi telefon dolandırıcılıklarında kullanıyor.

Portsmouth Üniversitesi’nin araştırmasına göre, 75 yaş üzerindeki kişilerin en az üçte ikisi telefon dolandırıcılığı girişimine maruz kalıyor. Dolayısıyla yaşlılar en fazla risk altındaki grup olarak öne çıkıyor. Ayrıca, bu girişimlerin yaklaşık yüzde 60’ının sesli aramalar yoluyla gerçekleştirildiği tespit edildi.

Her ne kadar bu aramaların tamamı yapay zeka destekli olmasa da, teknolojinin erişilebilirliği ve gelişmişliği sayesinde ses klonlama giderek daha yaygın hale geliyor. Hume AI ve ElevenLabs gibi araçlar, bu alandaki en bilinen örnekler arasında yer alıyor.

Araştırmaya katılanların yüzde 58'i yapay zeka tarafından klonlanmış sesleri gerçek sanıyor.
Araştırmaya katılan kişilerin yüzde 58'i yapay zeka ile klonlanmış sesleri gerçek sanmıştır. Canva

Yapay zeka klonlama teknolojisi, eğlence sektöründe de giderek büyüyen bir endişe kaynağı haline geldi. Birçok ünlünün sesi izinsiz biçimde kullanılıyor. Örneğin, geçen yıl Scarlett Johansson, OpenAI’nin ChatGPT hizmetinde kullanılan bir sesin, 'Her' filmindeki kendi sesine “ürkütücü derecede benzediğini” belirterek tepki göstermişti.

Benzer şekilde, kamuoyunu manipüle etmek veya yanlış bilgi yaymak amacıyla politikacıları ya da gazetecileri taklit eden ses kayıtlarının da giderek yaygınlaştığı görülüyor.

Bu tür rahatsız edici kötüye kullanımlar kamuoyunda giderek daha fazla yankı bulurken, Dr. Nadine Lavan yapay zeka geliştiricilerinin daha güçlü güvenlik önlemleri uygulama sorumluluğu taşıdığını vurguluyor.

“Biz araştırmacılar olarak, bu teknolojileri geliştiren şirketlerin etik uzmanları ve politika yapıcılarla iş birliği içinde hareket etmelerini öneriyoruz,” diyen Lavan, “özellikle seslerin mülkiyeti, rıza kavramı ve bu kavramların hızla değişen teknolojik ortamda nerelere kadar uzanabileceği gibi etik ve hukuki meselelerin dikkatle ele alınması gerektiğini” ifade etti.

Erişilebilirliğin iyileştirilmesi

Diğer tüm teknolojilerde olduğu gibi, yapay zeka tarafından üretilen sesler de doğru şekilde kullanıldığında önemli bir iyilik potansiyeline sahip. Özellikle konuşma yetisini kaybetmiş ya da iletişim kurmakta zorlanan bireyler için bu teknoloji büyük bir fark yaratabiliyor.

Dr. Nadine Lavan, “Bu tür yardımcı teknolojiler aslında yeni değil. Stephen Hawking bunun en bilinen örneklerinden biriydi,” dedi. “Ancak bugün farklı olan, bu sentetik seslerin artık önceki dönemlerde mümkün olmayan ölçüde kişiselleştirilebilmesi.”

“Artık kullanıcılar isterlerse kendi özgün seslerini yeniden yaratabiliyor, isterlerse de kimliklerini ve kişisel zevklerini yansıtan tamamen yeni bir ses tasarlayabiliyorlar.”

Lavan ayrıca, etik ve sorumlu biçimde kullanıldığında bu teknolojinin eğitim, yayıncılık ve sesli kitap üretimi gibi alanlarda erişilebilirliği ve çeşitliliği artırabileceğini vurguluyor.

Yakın zamanda yapılan bir araştırma da bu görüşü destekliyor: yapay zeka destekli sesli öğrenmenin, özellikle Dikkat Eksikliği ve Hiperaktivite Bozukluğu (DEHB) gibi nöroçeşitliliğe sahip öğrencilerin motivasyonunu ve okuma sürecine katılımını belirgin şekilde artırdığı tespit edildi.

“Bir diğer büyüleyici gelişme, bir sesi farklı dillere kopyalayabilme yeteneği,” diyen Dr. Nadine Lavan sözlerini şöyle sürdürdü: “Bu sayede insanlar kendi ses kimliklerini koruyarak dilsel sınırların ötesinde kendilerini ifade edebiliyor. Bu durum, küresel iletişim, erişilebilirlik ve kültürel etkileşim açısından dönüştürücü bir potansiyele sahip.”

Yapay seslerin hayatımıza giderek daha fazla entegre olduğu bu dönemde, onları nasıl kullandığımız ve onlarla nasıl etkileşim kurduğumuz da sürekli evriliyor. Lavan, yapay zeka tarafından üretilen seslerin insanlar tarafından nasıl algılandığını anlamaya yönelik araştırmaların bu sürece ışık tutabileceğini düşünüyor.

“Bir kişinin, duyduğu sesin yapay zeka tarafından üretilip üretilmediğini bilmesinin o sesle kurduğu etkileşimi nasıl değiştirdiğini daha derinlemesine incelemek isterim,” diyor.

Ayrıca, “Kulağa hoş gelen ama açıkça insan olmayan yapay zeka seslerinin nasıl algılandığını da merak ediyorum,” diye ekliyor. “Örneğin, insanlar bu hoş ama ‘insan dışı’ seslerden gelen talimatları izlemeye daha mı yatkın olur? Yoksa tersine, bir şeyler yanlış gittiğinde onlara kızma olasılıkları daha mı düşüktür?”

“Tüm bu sorular, araştırma açısından son derece ilgi çekici,” diyen Lavan, “çünkü bunlar bize insan ve bilgisayar arasındaki etkileşimlerde gerçekten neyin önemli olduğu hakkında çok şey anlatabilir.”