Dünya genelinde, genellikle grafik işlemcilerinde (GPU) özel hızlandırıcılarda eğitilen ve çalıştırılan genetik yapay zeka talebindeki artış, bu tür hızlandırıcıların dünya genelinde kıtlığını gösteriyor. Bu bağlamda, bulut devleri kendi çiplerini oluşturuyorlar. Amazon, yıllık re:Invent konferansında, özellikle nöral ağların eğitimi için tasarlanmış en yeni kendi hızlandırıcıları Trainium2'yi tanıttı. Ayrıca, Graviton4 adlı sunucu işlemcileri de tanıtıldı.
AWS Trainium2: Yüksek Performans ve Enerji Verimliliği
İki tanıtılan çipten ilki olan AWS Trainium2, Aralık 2020'de tanıtılan ilk Trainium nesline göre dört kat daha yüksek performans ve enerji verimliliğini iki katına çıkarabilir. Trainium2, Amazon Web Services müşterilerine EC Trn2 örneklerinde 16 çip içeren kümelerde sunulacak. AWS EC2 UltraCluster çözümünde, müşteriler büyük dil modellerini eğitmek için 100,000 Trainium2 çipine kadar erişebilecekler. Ne yazık ki, Amazon, Trainium2'nin AWS müşterilerine ne zaman sunulacağını belirtmedi; sadece "gelecek yılın bir yerinde" olacağını tahmin etti.
Amazon'un açıklamasına göre, 100,000 Trainium2 çipi, teorik olarak 65 Exaflops (saniyede quintillion işlem) hesaplama gücünü sağlayacak, bu da bir çekirdek başına 650 Terflops (trilyon işlem) anlamına gelir. Elbette, bunlar sadece teorik değerlerdir ve hesaplamaları karmaşıklaştıran faktörleri dikkate almak önemlidir. Ancak, bir Trainium2 çekirdeğinin gerçek performansını yaklaşık olarak 200 Terflops civarında sağlayabileceğini varsayarsak, bu, aynı amaca hizmet eden Google'ın çiplerinden önemli ölçüde daha yüksek bir kapasite anlamına gelir.
Trainium2 ile Büyük Dil Modellerinin Eğitimi
Amazon ayrıca vurguladı ki, 100,000 Trainium2 çipinden oluşan bir kümeler, birkaç hafta içinde 300 milyar parametreli büyük bir dil modelini eğitebilir. Daha önce bu tür görevler için aylar harcanıyordu. Lütfen unutmayın ki, LLM paradigması içinde parametreler, modelin belirli bir görevi çözmedeki ustalığını belirleyen eğitim veri setlerinden elde edilen öğelerdir. 300 milyar parametre, OpenAI'nin GPT-3'ünden yaklaşık %75 daha fazladır.
"Çipler, AWS müşterilerinin tüm iş yüklerinin temelini oluşturuyor, bu da onları AWS için yeniliklerin kritik bir alanı haline getiriyor," dedi AWS'nin hesaplama ve ağlar başkan yardımcısı David Brown. "Genetik AI'ye artan ilginin göz önüne alındığınında, Trainium2, müşterilere ML modellerini daha hızlı, daha uygun maliyetli ve daha enerji verimli bir şekilde eğitme konusunda yardımcı olacaktır."
Amazon'un Graviton4 İle Güçlenmesi
Amazon'un bugün duyurduğu ikinci çip ise Arm işlemcisi Graviton4'tür. Amazon, Graviton4'ün önceki nesil Graviton3'e (ancak daha yeni Graviton3E'ye değil) göre %30 daha yüksek performans, %50 daha fazla çekirdek ve %75 daha yüksek bellek bant genişliği sağladığını iddia ediyor. Bu nedenle Graviton4, kullanıcıların kullanımına sunulacak olan Amazon EC2 R8g dizilerinde 96 çekirdeğe kadar (ancak diğer konfigürasyonlar da olacak) ve DDR5-5600 bellek hızında 12 kanala kadar destek sunacaktır.
Graviton4'ün Graviton3'e göre bir diğer yükseltmesi ise tüm fiziksel donanım arayüzlerinin şifrelenmiş olmasıdır. Amazon'un iddiasına göre, bu, AI eğitimi ve müşteri verilerini artan gizlilik gereksinimleriyle daha güvenli bir şekilde korumaya yardımcı olacaktır.
"Graviton4, beş yıl içinde piyasaya sürdüğümüz dördüncü nesil işlemcidir ve geniş bir iş yükü yelpazesi için oluşturduğumuz en güçlü ve enerji verimli çiptir," diyor David Brown'un açıklamasında. "Gerçek iş yüklerine odaklanarak müşterilerimiz için en ileri düzeyde bir bulut altyapısı sunabiliyoruz."
Graviton4, kullanıcılara şu anda ön izleme sürümünde sunulan Amazon EC2 R8g dizilerinde kullanılabilir olacak.
 
                         
                         
                         
                         
                         
     
                         
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
                    