Gemini Embedding 2 tanıtıldı! 100’den fazla dilde veri analiz edebiliyor

Google, yapay zeka alanındaki çalışmalarını yeni bir modelle genişletiyor. Şirket, Gemini mimarisi üzerine geliştirilen ilk tam multimodal embedding modeli olan Gemini Embedding 2’yi tanıttı.

Yeni model, geliştiricilere farklı veri türlerini aynı sistem içinde analiz edebilen güçlü bir altyapı sunmayı hedefliyor.

Gemini Embedding 2’nin en dikkat çekici özelliği, metin, görüntü, video, ses ve belgeleri tek bir ortak anlam uzayında işleyebilmesi. Model bu sayede 100’den fazla dilde veri ilişkilerini analiz ederek içerikler arasındaki anlam bağlantılarını ortaya çıkarabiliyor.

Bu yaklaşım, özellikle semantik arama, duygu analizi, veri kümelendirme ve yapay zeka destekli bilgi sistemleri gibi alanlarda daha güçlü sonuçlar elde edilmesini sağlayabilir.

GELİŞTİRİCİLERE ERKEN ERİŞİM SUNULDU

Geliştiriciler, model sayesinde karmaşık veri yapılarıyla çalışan uygulamaları daha kolay oluşturabilecek.

Google, yeni modeli geliştiricilerin kullanımına Gemini API ve Vertex AI üzerinden ön izleme olarak açtı.

Erken erişim programına katılan bazı şirketlerin şimdiden büyük veri analizi, gelişmiş arama motorları ve çoklu veri tabanlı yapay zeka sistemleri geliştirmeye başladığı belirtiliyor.

TEKNİK KAPASİTE DİKKAT ÇEKİYOR

Modelin teknik özellikleri de oldukça geniş bir veri yelpazesini destekliyor. Gemini Embedding 2;

  • Metinlerde 8192 token’a kadar bağlam desteği,

  • Aynı istekte 6 adet PNG veya JPEG görüntü,

  • 120 saniyeye kadar MP4 veya MOV video,

  • Transkripsiyon gerektirmeden doğrudan ses analizi,

  • 6 sayfaya kadar PDF belge işleme gibi yetenekler sunuyor.

Uzmanlara göre bu tür multimodal embedding modelleri, yapay zekanın farklı veri türlerini birlikte anlayabilmesini sağlayarak daha gelişmiş arama sistemleri ve bilgi analiz araçlarının önünü açabilir. Google’ın yeni modeli de bu alandaki rekabeti bir adım daha ileri taşıyabilir.

Paylaş
Teknoloji Turu'nu Google'da kaynak olarak ekle