Bu çok modlu, geniş dil modeli, görsel sorgulamalar için yeni bir çağın başlangıcı olabilir.
Ferret'in Gizemli Doğuşu
Apple ve Cornell Üniversitesi'nden araştırmacılar, geçtiğimiz Ekim ayında, dikkat çekmeden Ferret'i yayına aldılar. Bu açık kaynak, çok modlu dil modeli, görsel sorgular için özel olarak tasarlanmış. 30 Ekim'de Ferret-Bench adı altında kodlar yayınlanırken, 14 Aralık'ta kontrol noktası sürümleri de tanıtıldı. Ferret, ticari olmayan bir lisansla sunulduğundan, şimdilik ticarileştirilmesi söz konusu değil. Ancak Apple'ın bu modeli gelecekte ürün ve hizmetlerinde kullanma ihtimali heyecan yaratıyor.
Ferret'in İşlevselliği Nasıl Çalışıyor?
Ferret, kullanıcıların görsel üzerinde belirlediği bir bölgeyi analiz ederek, bu alandaki öğeleri tanıyıp sınırlayıcı bir kutucuk çizebiliyor. Örneğin, bir hayvanın resmi üzerinde sorgu yaparak, Ferret bu hayvanın türünü tespit edip, kullanıcıya bilgi verebiliyor. Bu özellik, görsel sorgulamaları daha etkili ve doğru hale getiriyor.
Apple'ın Yapay Zeka Stratejisi ve Ferret'in Yeri
Microsoft, Google ve Meta gibi devlerin gölgesinde kalmış gibi görünen Apple, Ferret ile yapay zeka alanında iddialı bir adım atıyor. Bu hamle, Apple'ın yapay zeka sunucularındaki yetersizlikleri aşma yolunda önemli bir gelişme. Ferret, 80GB bellek ve 8 A100 GPU üzerinde eğitildi; bu da Apple'ın altyapı sorunlarını çözmeye başladığının bir işareti. Apple'ın bu yıl içinde yapay zeka için 5 milyar dolar harcama yapabileceği söylentileri de bu büyük hamlenin bir parçası.
Özetle, Ferret, Apple'ın yapay zeka yolculuğunda sessiz ama derinden gelen bir devrim. Bu model, görsel sorgulama tekniklerini yeniden tanımlayarak, kullanıcı deneyimini zenginleştirecek potansiyele sahip. Apple'ın bu girişimi, Siri'nin yapay zeka destekli gelecek versiyonu ve diğer yapay zeka yatırımlarıyla birleştiğinde, teknoloji devinin sektördeki konumunu daha da güçlendirecek gibi görünüyor.
 
             
                                             
                         
                         
                         
                         
                         
     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                    