Gemini 3 Flash İçin Yeni Agentic Vision Özelliği Duyuruldu

0

Google, yapay zeka dünyasında çığır açacak Gemini 3 Flash modeline eklenen yeni “Agentic Vision” yeteneğini resmi olarak tanıttı. Bu özellik, modelin görselleri sadece bir bakışta analiz etmek yerine, bir araştırmacı gibi adım adım incelemesini sağlıyor. Böylece yapay zeka, görsel verileri işlerken çok daha yüksek doğruluk oranlarına ulaşıyor.

Gemini 3 Flash ile Görsellerde Yüksek Doğruluk Dönemi

Yeni Agentic Vision yeteneği, görsel görevleri “görsel kanıtlara dayandırarak” çok daha hassas hale getiriyor. Standart yapay zeka modelleri dünyayı genellikle tek bir durağan bakışla işlerken, önemli detayları gözden kaçırabiliyorlar. Ancak bu yeni yaklaşım, görme yeteneğini aktif bir inceleme süreci olarak ele alıyor ve Python kodu yürütme araçlarıyla birleştiriyor.

Düşün, Harekete Geç ve Gözlemle Döngüsü

Model, kullanıcıdan gelen görsel içerikli komutları yanıtlarken “Düşün, Harekete Geç, Gözlemle” (Think, Act, Observe) döngüsünü kullanıyor. Öncelikle kullanıcı sorgusunu analiz eden yapay zeka, çok aşamalı bir plan oluşturuyor. Ardından, görseli manipüle etmek veya analiz etmek için otomatik olarak Python kodu üretiyor. Son aşamada ise elde ettiği verileri bağlam penceresine ekleyerek nihai cevabı hazırlıyor.

Karmaşık Tablolarda ve Detaylarda Kusursuz Sonuçlar

Gemini 3 Flash, görseldeki küçük detayları fark ettiğinde otomatik olarak yakınlaştırma yapabiliyor. Ayrıca model, yoğun veri içeren tabloları ayrıştırabiliyor ve bulguları görselleştirmek için kod çalıştırabiliyor. Bu yöntem, matematiksel işlemlerde yaşanan yanılma (halüsinasyon) payını büyük ölçüde azaltıyor. Test sonuçlarına göre bu yeni özellik, vizyon benchmark testlerinde %5 ile %10 arasında bir kalite artışı sağlıyor.


Yesilrobot.com e-bültenine kaydolarak, her hafta 15 bine yakın Yeşil Robot okurunun yaptığı gibi, tüm güncellemeleri E-posta kutunuzdan takip edebilirsiniz. Abonelik için tıklayınız