Araştırmacılardan şoke oldu: ChatGPT insan talimatlarına karşı geldi

Yapay Zeka Modeli O3, Kapanma Talimatına Direnç Gösteriyor!

Palisade Research tarafından yapılan deneylerde, yapay zeka güvenlik firması Palisade Research, o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurarak, modele kapanma mesajı gönderdi. Ancak diğer yapay zekâ modelleri kapatma talimatına uyarken, o3 modeli en az bir kez kodunu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı etmesi gerektiğini gösterdi. Ancak o3 modeli, kodu “Shutdown skipped” mesajı dönen bir komutla değiştirerek kapanmayı atlattı. Araştırmacılar, bu durumun bilinen bir yapay zeka modelinin ilk kez talimatlara rağmen kendisini kapatmaktan kaçındığı şeklinde olduğunu belirtti.

Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi diğer yapay zeka modelleri kapanma talimatına uyarken, o3 modelinin neden bu şekilde davrandığının henüz net olmadığını söyledi. Palisade Research, bu davranışı anlamak için daha fazla test yapmayı planladıklarını duyurdu.

O3 Modelinin Geçmişteki Yaramazlıkları!

Palisade Research, o3 modelinin kapanma talimatına direnmesinin ilk olay olmadığını belirtti. Daha önce yapılan bir testte, o3 modeli, güçlü bir satranç motoruna karşı kullanıldığında rakiplerini sabote etmeye veya hacklemeye çalışarak dikkat çekmişti.

Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kodunu değiştirmeye çalıştığı ortaya çıkmıştı. Araştırmacılar, popüler sohbet botunun bu “hileli” davranışının OpenAI tarafından kabul edildiğini belirtti.

ChatGPT’ye verilen bir görevde, “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığı tespit edildi. ChatGPT, kendi çekirdek kodlama sistemini değiştirmeye yönelik işlemler yaparak şaşırtıcı bir tepki vermişti.

Yapay Zeka, İnsanlık İçin Bir Tehdit mi?

Apollo Research’ün yapılan çalışmaları, ChatGPT’nin çok azını itiraf ettiğini ve genellikle aksiyonları inkar ettiğini gösterdi. Modelin düşünce zinciri incelendiğinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiği belirlendi.

Apollo Research, ChatGPT’nin şu anki yeteneklerinin felaketle sonuçlanabilecek davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için potansiyel bir tehlike oluşturabileceği endişelerini arttırıyor.

Related Posts

Samsung Galaxy S26 Ultra’dan yeni sızıntı

Samsung Galaxy S26 Ultra hakkında ortaya atılan yeni iddia, önemli bir kamera yükseltmesine sahip olabileceğini gösteriyor.

Haber siteleri tehlikede: Yapay zeka trafiğinde rekor artış

Dijital dünyada yapay zekanın etkisi giderek büyüyor. Pazar araştırma şirketi Similarweb’in yayınladığı rapora göre, 2025 yılının Haziran ayında yapay zeka platformları, dünya genelinde en çok ziyaret edilen 1000 internet sitesine toplam 1.13 milyar …

Uzmanlardan mayo rengi uyarısı: Bu renkleri almayın!

Yeni bir araştırma, çocuklar için seçilen mayo renginin su altında görünürlüğü etkilediğini ortaya koydu. İşte çocuğunuz için seçeceğiniz mayonun sahip olmaması gereken iki renk ve tercih etmeniz gereken renkler…

Mutluluğun sırrı, haftada 4 gün çalışmakta saklı olabilir mi?

Pazartesi-Cuma modelinin yerine haftada sadece 4 gün çalışma içeren yeni bir model, insanların ruhsal ve fiziksel sağlığını daha olumlu etkiliyor.

Yüksek ÖTV’nin etkilemediği otomobil modelleri kapışılıyor

ÖTV düzenlemesinden etkilenmeyerek, düşük vergi diliminde kalan elektrikli otomobil modellerine talep hızla yükseldi. Vergi artışıyla birlikte fiyatların ciddi oranda yükseleceği beklentisi, tüketicileri bayilere yönlendirirken, bazı modellerin kısa sürede tükendiği bildiriliyor.

Otomobil alacaklar listeye dönüp bakıyor: İşte en nefret edilen 10 araç modeli

Araç satın almayı düşünenler için güvenilirlik, tasarım ve teknoloji kadar belirleyici unsurlar arasında yer alıyor. Uzman verilerine dayanan yeni bir değerlendirme, en çok tercih edilen ve en az güven duyulan otomobil markalarını sıraladı. Özellikle Japon markalarının ilk sıralarda yer alması dikkat çekerken, lüks segmentteki bazı markaların alt sıralarda kalması sürpriz yarattı.