Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

Musk’ın kararları Tesla’yı vurmuştu… Protestolara maruz kalan şirketin yaptığı büyük stratejik hata

Elon Musk’ın devlet hizmetlerinde yaptığı benzeri görülmemiş kesintilere öfkelenen Amerikalıların, hoşnutsuzluklarını dile getirmek için Tesla galerilerini seçmesi Musk’ı fazlasıyla rahatsız etti. Geçtiğimiz günlerde X platformunda, ülke genelindeki Tesla Takedown gösterilerine atıfta bulunan Musk, “Bu paralı protestoları kim finanse ediyor ve organize ediyor?” şeklinde bir paylaşım yaptı. Ancak Musk için daha yerinde bir soru şu olabilir: “Galerilerimi gösteriler için bu kadar uygun hedefler haline getirecek şekilde kim inşa etti?” Çünkü cevabı Elon Musk’ın kendisi.

Merakla beklenen Deadlock yakında açık beta sürümüne kavuşabilir

10 yılı aşkın bir süredir Portal, Half-Life, Counter-Strike ve DotA serilerinin dışında bir oyun üretmeyen Valve, bu çizgiyi bozmaya hazırlanıyor. Bir süredir şirket içinde geliştirilen, kahraman nişancı ve MOBA türlerini birleştiren Deadlock …

Yeni nesil Siri, performansı ile şaşırtabilir!

Apple CEO’su Tim Cook, 2025 ikinci mali çeyrek sonuçlarının değerlendirildiği toplantıda; şirketin Apple Intelligence çatısı altında geliştirdiği yeni Siri özelliklerinin gecikeceğini açıkladı. Cook teknolojinin halen istenen kalite düzeyine …

Bilim kurgu değil, gerçek: Elektriği taşıyabilen bakteri keşfedildi

Oregon kıyılarındaki çamura gizlenmiş bu bakteri, vücudundaki nikel liflerle elektron taşıyarak enerji devrimini başlatabilir. Bilim, bakır tellerden çok daha ilginç bir alternatife işaret ediyor.

Casio, karbon fiber saat modelini tanıttı!

Casio, dayanıklılığıyla öne çıkan G-Shock serisine yeni bir model ekledi. MTG-B2000YBD-2A kod adıyla duyurulan saat; karbon fiber takviyeli yapısı, metal bileziği ve akıllı işlevleriyle dikkat çekiyor. Japonya’da yaklaşık 1.280 dolarlık fiyat …

Bitcoin’de son durum ne? İşte değeri!

Kripto varlıklar, geleceğin para birimi olarak giderek daha fazla ön plana çıkıyor. Özellikle Bitcoin, son dönemde art arda kırdığı rekorlarla yatırımcıların ilgisini üzerine çekmeyi başardı. Ancak kripto para piyasasının oldukça dalgalı olduğunu ve …

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir