Google, üretken yapay zekada şimdiye kadarki en iddialı projelerinden biri olan Gemini Omni modelini resmi olarak duyurdu.
“Any-to-any” yaklaşımıyla geliştirilen sistem; metin, görüntü, ses ve videoları aynı anda anlayıp yeniden üretebiliyor.
Yeni modelin en dikkat çeken özelliği ise video düzenleme tarafında ortaya çıktı. Kullanıcılar artık yalnızca birkaç cümlelik komut vererek videolardaki karakterleri değiştirebiliyor, ortamı dönüştürebiliyor veya sahneleri yeniden oluşturabiliyor.
Google’ın paylaştığı örneklerde kısa videoların sinematik aksiyon sahnelerine dönüştürüldüğü görüldü.

TEK YAPAY ZEKA, TÜM İÇERİK TÜRLERİ
Gemini Omni, Google’ın daha önce geliştirdiği ayrı görüntü, ses ve video modellerini tek altyapıda birleştiriyor. Şirket, bu sayede yapay zekanın içerikler arasında geçiş yapmadan daha tutarlı sonuçlar üretebildiğini söylüyor.
Google ayrıca sistemin fizik kurallarını daha gerçekçi yorumladığını belirtiyor. Yerçekimi, hareket ve çevresel etkileşimlerin daha doğal işlenmesi sayesinde yapay zeka videolarındaki “sahte görüntü hissinin” azaltıldığı ifade ediliyor.
DİJİTAL FİLİGRAN ZORUNLU OLACAK
Şirket, kötüye kullanım riskine karşı güvenlik önlemlerini de artırdı. Gemini Omni ile üretilen tüm videolara otomatik olarak SynthID dijital filigranı eklenecek. Bunun yanında duyurulan AI Content Detection API sistemi, farklı platformlardan gelen içeriklerin yapay zeka üretimi olup olmadığını analiz edebilecek.
Google ayrıca “Personal Avatars” adlı yeni sistemiyle kullanıcıların kendi ses ve görüntülerini yapay zeka içeriklerinde kullanmasına imkan tanıyacak.
Şimdilik yalnızca ücretli abonelik paketlerinde erişilebilen Gemini Omni’nin geliştirici API erişiminin önümüzdeki haftalarda açılması bekleniyor.