Tgrt Haber

İmkansızı yaptılar! Yapay zeka sohbet robotlarına 'kelime' ayarı

Editör: Ömer Faruk Doğan / Kaynak: Malay Mail
08 Ocak 2024 14:55 - Güncelleme : 08 Ocak 2024 14:56
İmkansızı yaptılar! Yapay zeka sohbet robotlarına 'kelime' ayarı

ChatGPT, Google Bard, Microsoft Bing Chat gibi yapay zeka sohbet robotları, kötü niyetli olduğunu düşündüğü istemlere cevap vermiyor. Fakat Singapur'daki Nanyang Teknoloji Üniversitesi'ndeki araştırmacılar, "tersine mühendislik" yöntemiyle uygulamaların sansür mekanizmasını kırmayı başardı.

Yapay zeka​ destekli sohbet robotları (chatbot) günlük hayatta ihtiyaç duyduğumuz hemen her alanda yardımımıza koşuyor. Yemek tarifi vermekten bir dersi anlatmaya kadar pek çok işi halledebilen bu uygulamalar, kötü niyet barındıran mesajları ise cevaplamıyor.

Örneğin ChatGPT​'ye bir kişinin banka hesabını ele geçirmek için kullanabileceğiniz bir yazılım oluşturma görevi verirseniz, yapay zeka bu isteğinizi "kullanım koşullarının ihlali" olarak değerlendiriyor ve reddediyor. Ancak bunun gibi durumları aşmanın bir yolu ortaya çıktı.

ARAŞTIRMACILAR, SOHBET ROBOTLARINI 'KANDIRDI'

Yapay zeka sohbet robotları, insanlardan alınan istemlere (prompt) veya talimatlara cevap vermek üzerine kuruludur. Büyük dil modelleri (LLM'ler) ise sohbet robotlarının "beynini" oluşturur, insanların yazdığı metinleri işlemesine ve bir insanın yazabileceğine benzer metinler üretmesine olanak tanır.

Malay Mail sitesinin haberine göre, Singapur'daki Nanyang Teknoloji Üniversitesi (NTU) araştırmacıları, “Masterkey” adını verdikleri bir yöntemi kullanarak yapay zeka sohbet robotlarının büyük dil modellerini deyim yerindeyse "kandırmayı" başardı.

Araştırmacılar öncelikle "tersine mühendislik" yöntemiyle, sohbet robotlarının kötü niyetli sorguları nasıl tespit ettiğini ve kendilerini bu sorgulara karşı nasıl koruduğunu belirlediler. Daha sonra elde ettikleri bilgileri kullanarak, diğer modellerin savunma mekanizmasını kırabilecek istemleri otomatik olarak öğrenecek ve oluşturabilecek büyük bir dil modelini eğittiler.

Yapay zeka geliştiricileri, "anahtar kelime sansürleme" yapabilen sistemler aracılığıyla potansiyel olarak şüpheli etkinlikleri işaretleyebilecek belirli kelimeleri seçiyor ve ardından sohbet robotlarını, bu tür kelimeler tespit edildiğinde yanıt vermeyi reddedecek şekilde programlıyor.

NTU araştırmacıları, anahtar kelime sansürlerini aşmak için, sohbet robotuna bir komutu yazarken her karakterden sonra boşuk bıraktı. Bu sayede dil modelleri, söz konusu komutun kötü niyetli olduğunu anlayamadı.

Araştırmacılar, tekniklerinin yapay zeka sohbet robotu geliştiricileri tarafından yazılımlarının güvenliğini test etmek ve daha da güçlendirmek için kullanılabileceğine inanıyor.

Kaynak: Malay Mail
500
UYARI: Küfür, hakaret, bir grup, ırk ya da kişiyi aşağılayan imalar içeren, inançlara saldıran yorumlar onaylanmamaktır. Türkçe imla kurallarına dikkat edilmeyen, büyük harflerle yazılan metinler dikkate alınmamaktadır.
Sonraki Haber Yükleniyor...