Cloudflare, yapay zeka modellerini potansiyel siber saldırılardan veya diğer kötü amaçlı tehditlerden korumak amacıyla kendi ağ güvenlik duvarını geliştiriyor. Bu güvenlik duvarı, modern ağ güvenliği standartlarını desteklemenin yanı sıra, kullanıcılar tarafından gönderilen yapay zeka modeli isteklerini analiz ederek potansiyel saldırıları önceden tespit etmeye çalışacak.
Yapay Zeka Modeli Güvenliği
Cloudflare Grup Ürün Yöneticisi Daniele Molteni'ye göre, geleneksel web uygulamaları ve API uygulamalarını etkileyen bazı zayıflıklar, büyük dil modelleri (LLM) dünyasına da uygulanabilir. Bu durum, LLM programlarının işleyişi nedeniyle yeni tehditlerin ortaya çıkmasına neden oluyor.
Veri Filtreleme ve Analiz
Kullanıcılar tarafından sağlanan veriler, Cloudflare üzerinden filtrelenir ve ardından gerçek yapay zeka modeline ulaşır. Cloudflare'un güvenlik duvarı, yapay zeka isteklerini durdurabilir ve potansiyel tehditleri taramak için analiz edebilir. Cloudflare, ChatGPT veya Claude gibi genel modellere gönderilen kullanıcı isteklerini, potansiyel olarak gizli bilgilerden arındırır.
Yapay Zeka ile Sansür
Cloudflare'un yapay zeka destekli güvenlik duvarı, kullanıcı tarafından sağlanan verileri yapay zeka modellerini "manipüle etme" potansiyeline karşı korur. Bu, modelin halüsinasyonlara veya diğer yanlış veya tehlikeli tepkilere yol açabilecek giriş verilerinin manipülasyonunu önlemeyi amaçlar.
İstismarları Engelleme ve Sansürleme
Cloudflare'un duyurusuna göre, müşteriler ayrıca "uygunsuz kategorilere giren istekleri engelleyebilecekler". Bu isteklerin yapay zekanın "toksik, aşağılayıcı veya sorunlu sözcük dağarcığı" kullanmasına yol açabileceği endişesi varsa, müşteriler bu istekleri engelleyebilir. Ancak, gerçek kullanıcı isteklerinin ne ölçüde sansürleneceği belirsizdir.
İşletme için Koruyucu Yapay Zeka Hizmeti
Bu hafta Cloudflare, işletmeler için Yapay Zeka Tabanlı Koruma hizmetini de tanıttı. Bu hizmet, web sitelerini yapay zeka temelli potansiyel tehditler açısından analiz eden bir sinir ağı kullanıyor.