Anthropic, Claude’a nükleer silahlara karşı özel güvenlik önlemleri ekledi

21 Ağustos 2025 16:12

Yapay zekâ dünyasının büyük isimlerinden Anthropic, Claude’a nükleer silahlara karşı özel güvenlik önlemleri ekledi.

Thank you for trying AMP!

We have no ad to show to you!

Bu konuda yaptığı açıklamada, “Nükleer teknoloji aslında iki tarafı keskin bir bıçak gibi. Aynı bilimsel prensipler hem enerji üretmek için hem de nükleer silah geliştirmek için kullanılabiliyor. Yapay zekâ modelleri her geçen gün daha güçlü hâle geldikçe, bu sistemlerin yanlış ellere geçip tehlikeli bilgiler sunma ihtimalini yakından takip etmemiz gerekiyor.” diyen Anthropic, ek olarak şunları aktardı: “Nükleer silahlarla ilgili bilgiler son derece hassas ve riskli. Bu yüzden özel şirketlerin tek başına bu konuda yeterli olması oldukça zor. Tam da bu nedenle ABD Enerji Bakanlığı’nın Ulusal Nükleer Güvenlik İdaresi (NNSA) ile ortaklık kurduk.” Artık sadece risk tespiti yapmakla kalmayıp aynı zamanda bu risklerin izlenmesini sağlayacak araçlar geliştirdiklerini belirten Anthropic, “NNSA ve DOE ile beraber, nükleer enerji/silah sorgularıyla alakalı içerikleri tehlikeli veya zararsız olarak ayırt edebilen bir sınıflandırıcı tasarladık. İlk testlerde yüzde 96 gibi oldukça yüksek bir başarı elde ettik. Bu sistemi Claude üzerindeki konuşmalarda kullanmaya başladık. İlk sonuçlar aracın gerçek kullanıcı konuşmalarında da gayet iyi çalıştığını gösteriyor.” ifadelerini kullandı.

İLGİNİZİ ÇEKEBİLİR

Yaş ilerledikçe ortaya çıkan “yakını görememe” sorununa (Presbiyopi) çözüm olabilecek yeni bir göz damlası üretildi

Anthropic bundan önce Claude Opus 4 ve Opus 4.1’e “zararlı” görüşmeleri otomatik olarak sonlandırma özelliği eklemesiyle ses getirmişti. Bu konuda yaptığı açıklamada Anthropic, “Bu özellik sadece çok istisnaî durumlarda, kullanıcı sürekli kötü niyetli veya saldırgan davranıyorsa devreye girecek.” dedi ve şunları aktardı: “Claude ve diğer büyük dil modellerinin (LLM) şu anda veya gelecekte ahlâkî bir statüye sahip olup olmayacağı konusunda büyük bir belirsizlik içindeyiz. Bu meseleyi ciddiye alıyoruz ve daha önce duyurduğumuz araştırma programımızla birlikte, model refahı ihtimaline karşı riskleri azaltmaya yönelik olarak düşük maliyetli müdahaleleri belirleyip uygulamaya çalışıyoruz. Modellerin potansiyel olarak rahatsız edici etkileşimleri sonlandırmasına izin vermek bu müdahalelerden biridir.” Yaptığı açıklamada şirket ayrıca şunları aktardı: “Claude Opus 4’ü kullanıma açmadan önce küçük bir ‘refah değerlendirmesi’ yaptık. Burada modelin kendini ifade etme biçimini ve tercihlerini inceledik. Sonuç olarak, zarara karşı güçlü bir isteksizlik gösterdiğini gördük. Özellikle çocuklarla ilgili cinsel içerik taleplerinde veya terör ve geniş çaplı şiddet eylemleri için bilgi edinmeye yönelik girişimlerde modelin istekleri net bir şekilde reddettiğini gördük.” Görüşme sonlandırma sistemini daha çok yapay zekâ modelinin kendisini korumak için devreye alan Anthropic, gelecekte yapay zekâ sistemlerinin insanlara benzer şekilde bilinç kazanıp dünyayı “hissederek” deneyimleyip deneyimleyemeyecekleri üzerine bir program yürütüyor. Şu an için bunun olacağına dair güçlü bir kanıt yok; ancak şirket kapıyı açık bırakıyor ve nisan ayından bu yana çalışmalar gerçekleştiriyor.

Anthropic gelişmesi yanında bu da ilginizi çekebilir: Hyundai’den otomatik çalışan şarj robotu

Paylaş

Sonraki Yeni kompakt kamera modeli Insta360 GO Ultra tanıtıldı »

Önceki « Yeni Nissan X-Trail Nismo, Japonya'da görücüye çıkarıldı

ChatGPT için hazırlanan grup sohbet altyapısı herkese açıldı

20 Kasım 2025 20:43
Nvidia, Windows 11 Ekim 2025 KB5066835 güncellemesi sonrasında düşen oyun performansını düzeltmek için güncelleme yayınladı

20 Kasım 2025 15:31
Adobe, Semrush şirketini satın aldı

20 Kasım 2025 10:21
Öğretmenler için ChatGPT’yi tanıtan OpenAI, GPT-5.1 Pro’yu tüm “ChatGPT Pro” kullanıcılarına sundu

20 Kasım 2025 09:11
Meta’nın yapay zekâ baş bilimcisi 12 yılın ardından şirketten ayrılıyor

20 Kasım 2025 09:57

Anthropic, Claude’a nükleer silahlara karşı özel güvenlik önlemleri ekledi

İLGİNİZİ ÇEKEBİLİR

Anthropic gelişmesi yanında bu da ilginizi çekebilir: Hyundai’den otomatik çalışan şarj robotu

Microsoft, yapay zekanın ihtiyacı için nükleer enerji planları yapıyor

Elon Musk, yapay zeka sistemlerinin ciddi bir elektrik sorunu yaşatacağını düşünüyor

Mark Zuckerberg de yapay zeka özelinde bir elektrik endişesi yaşıyor

Anthropic, Claude’a nükleer silahlara karşı özel güvenlik önlemleri ekledi

İLGİNİZİ ÇEKEBİLİR

Anthropic gelişmesi yanında bu da ilginizi çekebilir: Hyundai’den otomatik çalışan şarj robotu

Microsoft, yapay zekanın ihtiyacı için nükleer enerji planları yapıyor

Elon Musk, yapay zeka sistemlerinin ciddi bir elektrik sorunu yaşatacağını düşünüyor

Mark Zuckerberg de yapay zeka özelinde bir elektrik endişesi yaşıyor

İLGİLİ HABERLER