Çin merkezli teknoloji devi Baidu, açık kaynaklı yapay zeka alanında önemli bir adım attı.
Baidu, çok modlu (multimodal) veri işleyebilen yeni modeli ERNIE‑4.5‑VL‑28B‑A3B‑Thinking’i tanıttı.
Model, metin ve görselleri bir arada işleyerek daha gelişmiş çıkarımlar yapabiliyor.
ERNIE‑4.5‑VL‑28B‑A3B‑Thinking, yaklaşık 30 milyar parametreye sahip, ancak operasyon sırasında yalnızca 3 milyar parametre aktif olarak kullanılıyor. Bu sayede yüksek performansı düşük kaynakla sunabiliyor.
Model, görüntülerle düşünme özelliği sayesinde fotoğraf, grafik, video ve belgelerdeki bilgileri analiz edebiliyor. Baidu’nun açıklamasına göre model, özellikle mühendislik şemaları, üretim hattı videoları ve finansal grafikler gibi karmaşık görsel-veri setlerinde öne çıkıyor.

ERNIE‑4.5‑VL‑28B‑A3B‑Thinking, Apache 2.0 lisansı sayesinde ticari uygulamalarda da kullanılabiliyor. Uzmanlar, modelin çok modlu veri işleme kapasitesinin sektörde yeni kullanım alanları açacağını belirtiyor.
Baidu, ERNIE‑4.5‑VL‑28B‑A3B‑Thinking ile hem araştırmacılara hem de geliştiricilere güçlü bir araç sunarken, açık kaynak yaklaşımıyla yapay zeka ekosistemine katkıda bulunmayı hedefliyor.