Çinli yapay zekâ girişimi DeepSeek tarafından geliştirilen R1 yapay zekâ modeli güncellendi. R1 artık çok daha yüksek performans sağlıyor.
Hugging Face üzerinde yayımlanan “akıl yürütme” özellikli yeni sürüm DeepSeek-R1-0528, yapılan testlere göre kodlama başta olmak üzere birçok alandaki performansı hatırı sayılır seviyede artırıyor. Kodlama özelinde O4 Mini (Low), Grok-3-mini (High) ve Gemini 2.5 Flash Preview’ı geride bıraktığı belirtilen güncellenmiş model, daha doğal yazılı içerikler üretebiliyor ve düşünme/akıl yürütme sürecini 60 dakikaya kadar sürdürebiliyor. 685 milyar parametreli yeni model, ticari olarak kullanılabiliyor. Şirket bizim gündemimize en son DeepSeek-V3 ile gelmişti. Chat.deepseek.com üzerinden veya yerel olarak kullanılabilen açık kaynak model DeepSeek-V3, Qwen2.5-72B ve Llama-3.1-405B gibi diğer açık kaynak modellerden daha iyi performans sergiliyor. GPT-4o ve Claude-3.5-Sonnet ile benzer seviyede olduğu belirtilen 671 milyar parametreli sürüm, bilgi tabanlı görevlerde (MMLU, MMLU-Pro, GPQA, SimpleQA) selefi DeepSeek-V2.5’e göre önemli iyileşmeler gösteriyor ve bu alandaki mevcut en iyi model olan Claude-3.5-Sonnet-1022’ye yaklaşıyor.
İLGİNİZİ ÇEKEBİLİR
DeepSeek bunlardan önce bir açıklama ile gündeme gelmişti. ChatGPT’yi geliştiren yapay zeka şirketi OpenAI, Çin’in devlet destekli yapay zeka modellerini yasaklamasını talep ediyor. OpenAI, bir ara çok büyük yankı uyandıran Çin merkezli yapay zeka girişimi DeepSeek’i “devlet destekli” ve “devlet kontrollü” olarak tanımlıyor. Şirket, ABD hükümetine bu ve benzeri devlet destekli Çinli şirketlerden çıkan yapay zeka modellerini, ciddi güvenlik riskleri nedeniyle yasaklamayı düşünmesini tavsiye ediyor. Ayrıca, hükümetin yapay zeka eğitimi için telifli materyallerin serbestçe kullanılmasına izin vermesi gerektiğini savunuyor; aksi takdirde, yapay zeka yarışında Çin’in gerisine düşeceklerini öne sürüyor.
OpenAI, geçtiğimiz aylarda DeepSeek’e yönelik önemli bir suçlamada da bulunmuştu. DeepSeek’in gündeme gelmesinin ardından harekete geçen OpenAI, şirketin sundukları API’ları kullanıp kullanmadığını araştırmaya başladı. Konuya yakın kaynaklara göre Microsoft güvenlik araştırmacıları, 2024’ün sonlarında Çinli girişimle bağlantılı olduğuna inanılan büyük miktarda OpenAI verisinin sızdırıldığını tespit etti. Financial Times’a yaptığı açıklamada şirket, DeepSeek’in daha büyük ve daha yetenekli modellerden veri çekerek yapay zeka modellerini eğitmek için kullanılan bir teknikten faydalandığına dair kanıtlara sahip olduğunu belirtmişti. OpenAI CEO’su Sam Altman, “DeepSeek’in R1’i, özellikle maliyetine oranla sunabildikleri açısından etkileyici bir model. İleride çok daha iyi modeller sunacağız. Yeni bir rakibe sahip olmak heyecan verici!” demişti. Altman ayrıca, “Misyonumuzda başarılı olmak için daha fazla bilgi işlem gücünün her zamankinden daha önemli olduğuna inanıyoruz. Hepinizi AGI (Yapay Genel Zeka) ve ötesine götürmek için sabırsızlanıyoruz.” açıklamasını da yapmıştı.