AMD, yapay zeka (YZ) pazarında daha fazla varlık gösterme çabasıyla sadece donanım değil, aynı zamanda dil modelleri geliştirme çalışmalarına da başladı. Bu bağlamda, şirketin ilk küçük dil modeli olan AMD-135M'i duyurması, dikkatleri üzerine çekti.
AMD-135M Modeli ve Hedefleri
Yeni AMD-135M dil modeli, Llama ailesine ait olup, özel sektör uygulamaları için tasarlanmıştır. Şu an için AMD'nin bu yapay zeka modeli ile Silo AI adlı girişimi satın alması arasında herhangi bir bağlantı olup olmadığı netlik kazanmadı. Zira bu satın alma işlemi henüz tamamlanmamış ve çeşitli düzenleyici kurumlar tarafından onaylanmamıştır. Ancak, AMD'nin kendi donanımıyla oluşturduğu önceden eğitilmiş bir model ile belirli müşterilerin ihtiyaçlarını karşılamak için attığı bu adım oldukça önemlidir.
Speculative Decoding ile Verimlilik Artışı
AMD'nin dil modeli, spekülatif kodlama (decoding) adı verilen bir teknik kullanmaktadır. Bu yöntem, daha küçük bir "taslak model" üzerinden tek bir geçişte birden fazla aday token oluşturmayı sağlar. Bu token'lar daha sonra daha büyük ve daha hassas bir "hedef model"e iletilir ve burada kontrol edilip düzeltilir. Bu yaklaşım, aynı anda birden fazla token üretebilme avantajı sunsa da, veri iletimindeki artış nedeniyle güç tüketimini de artırabilir.
AMD-Llama-135M ve AMD-Llama-135M-Code
AMD'nin dil modeli iki versiyonda sunulmaktadır: AMD-Llama-135M ve AMD-Llama-135M-code. Her iki model de spekülatif kodlama teknolojisi ile belirli görevler için performans artırımı sağlamak üzere optimize edilmiştir. Temel model olan AMD-Llama-135M, toplam 670 milyar token içeren veriler üzerinde sıfırdan eğitilmiştir. Bu süreç, dört adet 8 kanallı AMD Instinct MI250 düğüm kullanılarak altı gün sürmüştür.
Yazılım Geliştirme İçin Özelleştirilmiş Model
AMD-Llama-135M-code modeli ise, yazılım kodu yazma odaklı olarak ek 20 milyar token ile yeniden eğitilmiştir. Bu ek eğitim süreci de aynı donanım seti kullanılarak dört gün içinde tamamlanmıştır. Şirket, modellerinin daha ileri optimizasyonları ile performans ve verimliliğin daha da artırılabileceğine inanmaktadır.
Yapay Zeka ve Geleceği
Yapay zeka teknolojileri hızla gelişirken, şirketlerin bu alanda attığı adımlar da büyük önem taşıyor. AMD'nin yeni dil modeli, kullanıcıların özel iş ihtiyaçlarını karşılamak amacıyla tasarlanmış olmasıyla dikkat çekiyor. Diğer yandan, bu tür yeniliklerin sektördeki rekabeti artırması ve kullanıcıların daha verimli çözümlere ulaşmalarını sağlaması bekleniyor.
Sonuç olarak, AMD'nin yapay zeka alanındaki bu girişimi, hem teknoloji dünyasında hem de özel sektör uygulamalarında önemli bir gelişme olarak değerlendirilebilir. Peki, siz AMD'nin bu yeni yapay zeka modelini nasıl değerlendiriyorsunuz? Düşüncelerinizi bizimle paylaşın!