Amerikan girişimi Cerebras Systems, makine öğrenimi ve diğer kaynak yoğun görevler için devasa WSE-3 işlemcisini tanıttı. Bu işlemci, önceki versiyona kıyasla watt başına iki kat daha fazla performans iddia ediyor.
Özellikler ve Performans
Yeni işlemcinin alanı 46,225 mm2'dir. TSMC'nin 5 nm teknolojisini kullanarak üretilen işlemci, 4 trilyon transistöre, 900.000 çekirdeğe ve 44 GB'lık bir SRAM belleğine sahiptir. FP16 işlemlerinde performansı 125 Petaflops olarak iddia ediliyor.
Cerebras CS-3 Platformu
WSE-3, yeni bir hesaplama platformu olan Cerebras CS-3'ün temelini oluşturuyor. Şirketin iddiasına göre, CS-3 platformu, enerji tüketimi aynı kalırken önceki CS-2 platformuna göre iki kat daha yüksek performans sağlıyor. Cerebras CS-3 platformu, Nvidia H100 hızlandırıcı temelli platformla karşılaştırıldığında fiziksel olarak 57 kat daha büyük ve FP16 işlemlerinde yaklaşık 62 kat daha hızlıdır.
Optimizasyon ve İşbirliği
Cerebras, Qualcomm ile birlikte Cloud AI100 Ultra modelleri için model optimizasyonu üzerinde çalışacak. Bu optimizasyonda seyreklik, spekülatif kod çözme, MX6 ve ağ mimarisi araştırması gibi yöntemlerin avantajları kullanılacak.
Gelecek Odaklı Yöntemler
Cerebras CEO'su Andrew Feldman, "Daha önce gösterdiğimiz gibi, doğru bir şekilde uygulandığında seyreklik, hızlandırıcıların performansını önemli ölçüde artırabilir. Spekülatif kod çözme, başlangıçta küçük ve hafif bir model kullanarak ilk cevabı üretme ve daha sonra bu cevabın doğruluğunu kontrol etme yöntemidir" şeklinde belirtti.
Yöntemlerin Kullanımı ve Etkileri
Cerebras ve Qualcomm, MX6 yönteminin kullanımını değerlendiriyor. MX6, modelin boyutunu azaltarak modelin doğruluğunu azaltan bir sıkıştırma formudur. Ağ mimarisi araştırması ise belirli görevler için sinir ağlarının otomatik olarak tasarlanması sürecidir. Cerebras'a göre, bu yöntemlerin kombinasyonu dolar başına performansta on kat artışa yol açıyor.