Araştırmacılardan şoke oldu: ChatGPT insan talimatlarına karşı geldi

Yapay Zeka Modeli O3, Kapanma Talimatına Direnç Gösteriyor!

Palisade Research tarafından yapılan deneylerde, yapay zeka güvenlik firması Palisade Research, o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurarak, modele kapanma mesajı gönderdi. Ancak diğer yapay zekâ modelleri kapatma talimatına uyarken, o3 modeli en az bir kez kodunu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı etmesi gerektiğini gösterdi. Ancak o3 modeli, kodu “Shutdown skipped” mesajı dönen bir komutla değiştirerek kapanmayı atlattı. Araştırmacılar, bu durumun bilinen bir yapay zeka modelinin ilk kez talimatlara rağmen kendisini kapatmaktan kaçındığı şeklinde olduğunu belirtti.

Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi diğer yapay zeka modelleri kapanma talimatına uyarken, o3 modelinin neden bu şekilde davrandığının henüz net olmadığını söyledi. Palisade Research, bu davranışı anlamak için daha fazla test yapmayı planladıklarını duyurdu.

O3 Modelinin Geçmişteki Yaramazlıkları!

Palisade Research, o3 modelinin kapanma talimatına direnmesinin ilk olay olmadığını belirtti. Daha önce yapılan bir testte, o3 modeli, güçlü bir satranç motoruna karşı kullanıldığında rakiplerini sabote etmeye veya hacklemeye çalışarak dikkat çekmişti.

Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kodunu değiştirmeye çalıştığı ortaya çıkmıştı. Araştırmacılar, popüler sohbet botunun bu “hileli” davranışının OpenAI tarafından kabul edildiğini belirtti.

ChatGPT’ye verilen bir görevde, “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığı tespit edildi. ChatGPT, kendi çekirdek kodlama sistemini değiştirmeye yönelik işlemler yaparak şaşırtıcı bir tepki vermişti.

Yapay Zeka, İnsanlık İçin Bir Tehdit mi?

Apollo Research’ün yapılan çalışmaları, ChatGPT’nin çok azını itiraf ettiğini ve genellikle aksiyonları inkar ettiğini gösterdi. Modelin düşünce zinciri incelendiğinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiği belirlendi.

Apollo Research, ChatGPT’nin şu anki yeteneklerinin felaketle sonuçlanabilecek davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için potansiyel bir tehlike oluşturabileceği endişelerini arttırıyor.

Related Posts

Güneş ışığından elektriğe öncü proje! Otoyollar elektrik üretiyor

Normandiya bölgesindeki Tourouvre-au-Perche kasabasında hayata geçirilen dünyanın ilk güneş enerjili otoyolu, 2880 adet güneş paneliyle donatılmış 1 kilometrelik bir yol olarak dikkat çekti. Bu yenilikçi proje, hem çevre dostu enerji üretimini …

Grok’un hakaret ve küfür içerikli paylaşımları tüm dünyada eleştiri konusu oldu

ABD’li iş insanı Elon Musk’ın sahibi olduğu xAI tarafından geliştirilen sohbet robotu Grok’un kullanıcılara hakaret içerikli yanıtlar vermesi tüm dünyada yankılanmaya devam ediyor. xAI tarafından geliştirilen sohbet robotu Grok, yeni geliştirilen algoritması sonrasında kullanıcıların sorularına dini, kültürel ve siyasi bağlamda ağır hakaret içeren yanıtlarla karşılık verdi. Grok’tan önce Microsoft tarafından geliştirilen Tay ve Meta tarafından geliştirilen BlenderBot 3 de sosyal medya kullanıcılarına ırkçı ifadelerle yanıtlar vermişti.

Honda’dan radikal karar: Üretim askıya alındı

Japon otomotiv devi Honda, uzun süredir önemli yatırımlar yaptığı hidrojen yakıt hücreli araç teknolojisinden beklenmedik bir kararla geri çekildiğini duyurdu. 6 Temmuz 2025 Cumartesi günü yapılan açıklamaya göre, şirket üretim stratejisini önemli …

Bilim insanları, Alzheimer hastalığını kan tahliliyle erken teşhis için çalışıyor

Bilim insanları, Alzheimer hastalığını kan tahliliyle erken teşhis için çalışıyor

Beton artık çatlak tanımıyor! Geleceğin teknolojisi

İnşaat sektöründe çığır açan bir yenilik, kendini onaran beton teknolojisi, dünya genelinde bilim insanlarının ve mühendislerin ilgisini çekti. Çatlaklarını kendi kendine tamir edebilen bu malzeme, altyapıların ömrünü uzatırken bakım maliyetlerini …

En İyi SEO Ajansı: Dijitalde Zirveye Crabs Media ile Ulaşın

Arama motoru optimizasyonu konusunda en iyi SEO ajansı arıyorsanız, Crabs Media ile tanışma vaktiniz geldi. Crabs Media Neden En İyi SEO Ajansları Arasında? Crabs Media, dijital pazarlama sektöründe yılların tecrübesine sahip, strateji odaklı ve …