Anthropic yeni yapay zeka modelini tanıttı: Claude Opus 4.5 sahnede!

Yapay zekâ rekabeti hız kesmeden sürerken, Anthropic şimdi de sahneye en güçlü modellerinden biriyle çıkıyor.

Şirket, Claude Opus 4.5’i tanıtarak özellikle yazılım geliştirme, bilgisayar kullanımı ve ajan sistemleri üzerine yoğunlaşan büyük bir güncelleme sundu.

Yeni model, yalnızca seleflerini değil, OpenAI ve Google’ın en güncel amiral gemisi modellerini bile zorlayacak seviyede performans sergiliyor.

REKOR BAŞARIYA İMZA ATILDI

Anthropic’in açıklamasına göre Opus 4.5’in en dikkat çeken yönü, yazılım geliştirmede ulaştığı çıta. Model, hataları gerçek kod tabanlarında test eden SWE-Bench Verified ölçümünde %80,9 gibi rekor bir başarıya imza attı.

Bu skor, hem Gemini 3.0 hem de GPT-5.1-Codex-Max modellerinin üzerine çıkmış durumda. Ancak modelin iddiası yalnızca sentetik testlerle sınırlı olmadığı belirtildi.

Anthropic, slayt düzenleme, elektronik tablo işlemleri ve derin araştırma gibi gerçek dünya görevlerinde de gözle görülür bir sıçrama olduğunu vurguluyor.

ÜSTÜN SONUÇLAR VERİYOR

Opus 4.5; Terminal-bench, araç kullanımı odaklı tau2-bench ve MCP Atlas, genel problem çözmeye yönelik ARC-AGI 2 ile GPQA Diamond testlerinde de üstün sonuçlar veriyor.

Şirket, özellikle bilgisayar kullanımı ve ofis verimliliği alanlarında güçlenen model için paralel ürünlerini de genişletiyor.

Daha önce pilot olarak sunulan Claude for Chrome ve Claude for Excel, bu güncellemeyle çok daha geniş bir kullanıcı kitlesine ulaşıyor. Chrome uzantısı tüm Max kullanıcılarına, Excel odaklı model ise Max, Team ve Enterprise paketlerine açılıyor.

DAHA İSTİKRARLI VE VERİMLİ ÇALIŞIYOR

Yeni sürümün bir diğer önemli yeniliği, uzun bağlamlı işlemlerde hafıza yönetiminin ciddi şekilde iyileştirilmesi. Bu sayede model uzun sohbetlerde veya çok adımlı karmaşık görevlerde daha istikrarlı ve verimli çalışıyor.

Anthropic, Opus 4.5’in yalnızca daha güçlü değil, aynı zamanda daha güvenli olduğunu da belirtiyor. Model, kötü niyetli komutları ayırt etme ve kullanım politikalarını ihlal eden girişimleri engelleme konusunda önceki sürümlere göre çok daha dayanıklı.

OpenAI’ın 12 Kasım’da çıkan GPT-5.1 modeli ve Google’ın 18 Kasım’da duyurduğu Gemini 3 ile rekabet edecek olan Opus 4.5, yapay zekâ alanındaki güç dengelerini yeniden şekillendirecek gibi görünüyor.

Paylaş
Teknoloji Turu'nu Google'da kaynak olarak ekle