Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

Microsoft: Windows 11 24H2 sürümü herkes için indirilebilir

Microsoft, Windows 11 24H2 sürümünü geçen yılın Ekim ayında yayınladı. Windows 11 2024 güncelleştirmesi, Dosya Gezgini’nde yeni özellikler, Telefon Bağlantısı ve Güç Ayarları arayüzüyle güncellenmiş Başlat menüsü, görüntülü görüşmeye yönelik …

Akıllı telefon sahiplerine acil uyarı: 35 kuralını çiğnemeyin!

Akıllı telefon kullanıcıları için firmalardan sıcaklık 35 °C’yi aştığında cihazınızı derhal serin bir ortama taşıyın, uyarısı geliyor.

Moto Edge 70 için geri sayım: Tasarımı ortaya çıktı!

Motorola, ürün yelpazesini genişletmek için çalışmalarını sürdürüyor. Marka bu kapsamda önümüzdeki dönemlerde Edge 70 modelini tanıtacak. Son gelişmeler, ürünün tasarımını gözler önüne seriyor. Peki, Moto Edge 70 nasıl görünecek? İşte ayrıntılar …

Cam gibi görüntü arayanlara: En iyi ekrana sahip akıllı telefonlar!

Bir akıllı telefon satın alırken ekran kalitesi genellikle en önemli kriterlerden birisi. Kullanıcı tercihleri doğal olarak değişkenlik gösterse de, büyük bir kesimin cam gibi pürüzsüz ve akıcı ekranları diğer özelliklere tercih ettiğini …

Google NotebookLM kendi uygulamasına kavuşuyor

Google genelde son kullanıcıya yönelik yapay zekâ özelliklerini Gemini ara yüzü üzerinden sunuyor ancak akademik gibi görünse de herkesin kolay bir şekilde yararlanabileceği ikinci bir ara yüzü daha var.  Google NotebookLM cebinize giriyor …

Google ve Apple tekeline karşı koalisyon kuruluyor!

Google ile Apple’ın uygulama mağazaları üzerindeki hakimiyetine karşı dikkat çeken bir girişim yapılıyor. Meta ve Spotify’ın başını çektiği bir grup şirket, “Rekabetçi Mobil Deneyim Koalisyonu” adıyla bir ittifak kurdu. Koalisyon, iki teknoloji …

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir