Google Gemini 3'e yeni özellik! Agentic Vision duyuruldu

Google, yapay zeka modeli Gemini 3 Flash için dikkat çeken yeni bir özelliği kullanıma sundu.

Agentic Vision adı verilen bu yenilik sayesinde yapay zeka, görselleri yalnızca yorumlamakla kalmıyor; Python kodu yazarak görüntüler üzerinde adım adım analiz yapabiliyor.

Google, bu yöntemle görsel algılamada hata payının önemli ölçüde azaltıldığını açıkladı. Yeni özellik, görsel analiz sürecini daha sistematik hale getiriyor.

Gemini 3 Flash, bir görüntüyle karşılaştığında önce yapılacak işlemleri planlıyor, ardından kod aracılığıyla kırpma, yakınlaştırma, işaretleme ve nesne ayırma gibi adımları uyguluyor.

Elde edilen veriler doğrultusunda nihai yanıt oluşturuluyor. Google tarafından paylaşılan bilgilere göre Agentic Vision, özellikle sayım, nesne tespiti ve görsel mantık gerektiren görevlerde daha yüksek doğruluk sunuyor.

Model, örneğin bir fotoğraftaki nesneleri tek tek işaretleyerek analiz edebiliyor ve böylece yanlış çıkarımların önüne geçiyor. Şirket, bu yaklaşımın klasik görsel analiz yöntemlerine kıyasla daha güvenilir sonuçlar verdiğini vurguluyor.

Kod tabanlı işlem yapısı sayesinde Gemini 3 Flash, görselleri tek bakışta değerlendirmek yerine, kontrollü ve doğrulanabilir bir analiz süreci yürütüyor.

Agentic Vision özelliği şu an için geliştiricilere yönelik olarak Gemini API, Google AI Studio ve Vertex AI platformları üzerinden erişime açıldı. Google, ilerleyen dönemde bu teknolojinin son kullanıcıya yönelik Gemini araçlarına da entegre edilebileceğini belirtiyor.

Uzmanlara göre bu güncelleme, yapay zekanın görsel dünyayı daha doğru anlaması açısından önemli bir adım olarak değerlendiriliyor. Google’ın yeni hamlesi, özellikle görsel veriyle çalışan sektörlerde Gemini 3’ün kullanım alanlarını genişletebilir.

Paylaş
Teknoloji Turu'nu Google'da kaynak olarak ekle