Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

Xiaomi ucuz ev üretti, 11 bin TL’lik fiyatı ile yoğun talep görüyor

Proje kapsamında toplam 2.658 adet daire yer alıyor. Göz kapaştıcı bir tasarıma sahip olan dairelerin her biri 29 metrekare büyüklüğünde, eşyalı olarak ve aylık 280 dolarlık (yaklaşık 11 bin TL) kirayla çalışanların kullanımına sunuldu. Dairelerde …

TRT 1 canlı izle 24 Haziran: Benfica Bayern Münih maçı TRT 1 canlı yayın izle

2025 FIFA Kulüpler Dünya Kupası C Grubu’nda bu akşam Benfica ile Bayern Münih karşı karşıya gelecek. Saat 22.00’da başlayacak mücadele TRT 1 ekranlarından ve Tabii platformu üzerinden canlı olarak yayınlanacak. TRT 1 canlı yayınını izlemek isteyen ve Benfica Bayern Münih mücadelesindeki önemli dakikaları ve golleri takip etmek isteyenler sayfamızdaki linki kullanmaları yeterli. İşte Benfica Bayern Münih maçı TRT 1 canlı izleme sayfası ve maçtan notlar.

En güçlü astronomi kamerasından ilk görüntüler geldi: Sonuçlar büyüleyici!

Vera Rubin Gözlemevi’nin kullandığı dünyanın en güçlü astronomi kamerası olarak kabul edilen cihazdan ilk görüntüler gelmeye başladı. Galaksiler, Nebulalar ve 2.000’in Üzerinde Asteroit!

Drone sürüleri zihinle uçuyor! Beynin komutası

İnsansız hava araçları (UAV), yani drone’lar, tarımdan güvenliğe, lojistikten sinematografiye kadar birçok alanda hayatımızın vazgeçilmez bir parçası haline geldi. Ancak bu araçların kontrolü genellikle karmaşık kumandalar, radyo denetleyicileri veya …

ChatGPT’ye bir çocuğun nasıl para kazanacağını sordu: Yanıtlar gerçeklikten o kadar kopuk ki…

OpenAI’nin yapay zekâ modeli ChatGPT’ye basit bir soru yöneltildi: “Bir çocuk nasıl para kazanabilir?” Verdiği yanıtlar ilk bakışta sevimli ve öğretici görünse de, dikkatli incelendiğinde günümüzün ekonomik ve sosyal gerçekliklerinden oldukça uzak bir tablo çizdiği görülüyor.

WhatsApp’ta yapay zekâ mesaj özetleri test ediliyor

Apple’ın yalnızca belirli cihazlarda sunduğu yapay zekâ destekli bildirim özetleri, kullanıldığı zaman oldukça faydalı olabiliyor. Ancak bu özellik Apple Intelligence ile sınırlı kaldığı için, çoğu iPhone kullanıcısı halen bu teknolojiden yararlanamıyor. Şimdi ise WhatsApp, benzer bir yapay zekâ özelliğini Android kullanıcıları için test etmeye başladı: Uygulama içi mesaj özetleme.