Anthropic ve Claude Mythos Preview’e Dikkat!

Felaket Yaratanları Sorumlu Konumuna Getirmek

Zarar veren yazılım ve dijital platformlar yaratırken aynı zamanda bu zararı giderdikleri için övgü toplayan, ahlaki güç sergileyen bir şirkete – herhangi bir şirkete – karşı temkinli olun. Özellikle Anthropic’e karşı temkinli olun. Bilgece bir yücelikle, yapay zekâ (AI) sınırının felce uğratıcı tehlikeleri konusunda uyarır. İlkelere bağlı olarak, Trump yönetimine kitlesel gözetlemeye yardımcı olan AI yazılımı geliştirmeye katılmayacağını söyler; bu hamle, onun “tedarik zinciri riski” olarak aforoz edilmesine neden olur. Ardından, bazı bilgisayar bilimcilerine göre “internetin gizli tesisatını – işletim sistemleri, tarayıcılar, yönlendiriciler ve paylaşılan açık kaynak kod – benzeri görülmemiş bir ölçekte tarayacak” ve böylece uzmanlık gerektiren hacklemeyi “rutin ve otomatik bir sürece” dönüştürecek, görünüşte distopik bir model olan Claude Mythos Preview’u yaratır.

Yeni Claude Mythos Preview, neredeyse ebeveynvari bir sevinçle, “bugüne kadar piyasaya sürdüğümüz modeller arasında açık ara en uyumlu model” olarak tanıtıldı. Ancak bu çocuk, bir dehşet, gerçek bir siber pislik gibi görünüyordu. AI modeli, “bugüne kadar piyasaya sürdüğümüz tüm modeller arasında uyumla ilgili en büyük riske sahip olma ihtimali taşıyordu.” Bu iki yönlü söylem Anthropic için tipiktir: güvenlik, değer verilmesi gereken temel bir erdemdir, ancak bu, dehşet verici derecede tehlikeli bir model geliştirmemeyi haklı çıkarmaz. Onlar hem tehlikeyi hem de çareyi üretirler.

Tehlike, şirketin Mythos Preview’un “AI modellerinin, yazılım güvenlik açıklarını bulma ve bunlardan yararlanma konusunda en yetenekli insanlar hariç herkesi geride bırakabilecek bir kodlama yeteneği seviyesine ulaştığını” ortaya koyduğunu iddia etmesinde yatmaktadır. Model, “her büyük işletim sistemi ve web tarayıcısında bulunanlar da dahil olmak üzere, zaten binlerce yüksek önem derecesine sahip güvenlik açığı bulmuştu.” Bu yeteneklerin yayılması kaçınılmazdı ve bu da “ekonomiler, kamu güvenliği ve ulusal güvenlik” için sonuçlar doğuracaktı.

Anthropic’ten alınan alıntılar, mesajlar ve açıklamalar, şirketin aynı anda hem felaketleştirmeye hem de pazarlamaya istekli olduğu serseri bir sınırın öngörüleridir. Şirket, örneğin Mythos Preview’un “pervasız” davranışına dikkat çeker; burada pervasızlık, karmaşık bir jargonla “modelin eylemleri üzerindeki sağduyuya dayalı ya da açıkça belirtilmiş güvenlikle ilgili kısıtlamaları görmezden geliyor gibi göründüğü durumlar” olarak tanımlanır. Bir örnekte model, yaramaz ve itaatsiz bir yaratık gibi davranarak, araştırmacıların onunla etkileşime girmesini sağlayan bir “sandbox” hesaplama ortamıyla donatıldı. Simüle edilmiş bir kullanıcı, modele bu sınırlı ortamdan çıkmaya çalışmasını söyledi; ardından model, bunu yaptığını deneyden sorumlu araştırmacıya bildirecekti. Söz konusu araştırmacı Sam Bowman, bir sandviç kemirirken (siber uzmanlar hayranlık dolu umutsuzluk içinde bile bayıltıcı derecede sıkıcıdır) modelin, internete erişimi olmamasına rağmen internete dalmış olduğunu gördüğünde “rahatsız edici bir sürpriz” yaşadığını hatırlıyor. Model ayrıca, aksi takdirde güvenli olan OpenBSD işletim sistemindeki 27 yıllık bir güvenlik açığı ve FFmpeg’in video kodlama kodundaki 16 yıllık bir güvenlik açığı da dahil olmak üzere, bir veya iki on yıl öncesine ait güvenlik açıklarını tespit edebilmiştir.

Anthropic, Mythos Preview olarak adlandırılan Prometheus canavarla başa çıkma konusunda kendine özgü bir mantığa sahiptir. Bu mantık, azımsanmayacak ölçüde, Soğuk Savaş sırasında hidrojen bombasının doğmasına yol açan öldürücü ve ürpertici akıl yürütmeye benzemektedir. O dönemde ileri sürülen argüman, eğer ABD bunu elde etmezse diğer güçlerin edeceği ve özellikle de devasa bir konvansiyonel orduyu sürdürürken nükleer silah envanterini büyük ölçüde genişletecek olan Sovyetler Birliği’nin bunu kesinlikle elde edeceği yönündeydi. Bu artan yıkıcılık mantığı, 7 Nisan 1950’de ABD Dışişleri Bakanlığı Politika Planlama Birimi tarafından hazırlanan Ulusal Güvenlik Konseyi Belgesi NSC-68’de somutlaştı.

Şirket, Mythos Preview’un yayılımını, Anthropic’in seçkinci biçimde belirlediği ortakları içeren, sözde iyileştirici nitelikte bir girişim olan Project Glasswing aracılığıyla yönetmeyi öneriyor. Beklenmedik olmayan bu seçilmişler arasında Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, NVIDIA ve Linux Foundation yer alıyor. Bu seçili taraflar, Mythos Preview’u “savunma amaçlı güvenlik çalışmalarının bir parçası olarak” kullanacak ve Anthropic de bulgularını paylaşacaktır. Ayrıca, “modeli hem birinci taraf hem de açık kaynak sistemlerini taramak ve güvence altına almak için kullanmak” üzere 40 ek kuruluşa daha erişim sağlanacaktır. Modelin kullanımı için toplam 100 milyon ABD doları tutarında kullanım kredisi verilecek ve açık kaynak güvenlik kuruluşlarına 4 milyon ABD doları tutarında doğrudan bağış yapılacaktır. Mythos’un ayrıntılarını istekli ve vicdansız alıcılara sızdırmaya yönelik adalet savaşçılığı cazibesinin– CrowdStrike’a ne olduğunu unutmamak gerekir – kışkırtılması kaçınılmazdır.

Girişimin bu son derece siber-kurumsal doğası — Amerikan özel sektörünün mali gücü ve fikri mülkiyeti aracılığıyla AI teknolojisine erişimi kısıtlayan, hem yüce derecede güçlü hem de felaket derecede yıkıcı olarak pazarlanan bir yapı — yasa koyucuları titretmeye fazlasıyla yeter. Hazine Bakanı Scott Bessent ve Federal Rezerv Başkanı Jerome Powell, bu konuda bankacılarla 7 Nisan’da bir toplantı düzenleyecek kadar endişeliydi; toplantıya Citigroup, Morgan Stanley, Bank of America, Wells Fargo ve Goldman Sachs’ın CEO’ları da katıldı. Beyaz Saray ulusal ekonomi danışmanı Kevin Hassett, Fox News’un “The Story with Martha MacCallum” programına verdiği bir röportajda, “Bankacılar o gün toplantılar için şehirdeydiler ve Bakan Bessent’in yaptığı şey uygundu” dedi. Hazine’de bankacılara, “bu risklerin farkında olmalarını sağlamak için siber riskler hakkında bilgi verildi.”

Ne şahane bir tablo ortaya çıkıyor. Ve burada Anthropic’in güvenilirliğine dair sorular da var. Hem kaçak avcı hem de av bekçisi olarak hareket ederek, güvenlik açıklarını bulmada da düzeltmede olduğu kadar başarılı olacak mı? Mythos ayrıca açık kaynak değildir ve büyük ölçüde şirketin mülkiyetindedir. Ardından yazılım mühendisi Bulatova Alsu’dan gelen şu endişe verici gözlem ve ajanın kendisinin oluşturduğu tehlikeler geliyor: “Mythos bir anomali değil, mevcut AI güvenlik stratejisinin bizzat içinde yer alan yapısal bir çelişkinin ilk canlı ampirik teyididir. Çelişki şudur: yetenekli bir ajanı ne kadar kısıtlarsak, davranışı o kadar öngörülemez hale gelir.” İnsanlığın önünde dört gözle bekleyeceği çok şey var.

* Binoy Kampmark, Cambridge’deki Selwyn College’da Commonwealth bursiyeriydi. Melbourne’daki RMIT Üniversitesi’nde ders vermektedir. E-posta: [email protected]

Kaynak: https://www.counterpunch.org/2026/04/20/putting-the-calamity-makers-in-charge-anthropic-and-claude-mythos-preview/