Meta, WhatsApp, Messenger ve Instagram'a entegre edilen Meta AI asistanını destekleyen yeni yapay zeka model ailesi Llama 4'ü tanıttı. "Scout" ve "Maverick" adlı iki modelle sahneye çıkan Llama 4, hem performans hem de verimlilik açısından OpenAI ve Google gibi devlere meydan okuyor.
Meta; WhatsApp, Messenger ve Instagram'da kullanılabilen Meta AI asistanına güç veren en yeni yapay zeka modeli koleksiyonu olan Llama 4 ile karşımıza çıktı. The Verge sitesinin haberine göre, Meta veya Hugging Face üzerinden indirilebilecek Llama 4 ailesi, "Scout" ve "Maverick" olmak üzere iki modeli kapsıyor.
Llama 4 Scout, tek bir Nvidia H100 GPU'ya sığabilen küçük bir model iken Llama 4 Maverick de GPT-4o ve Gemini 2.0 Flash'a benzer, daha güçlü bir model olarak kullanıcılarına hizmet verecek. Diğer yandan, Meta'nın hâlâ eğitme sürecinde olduğunu belirttiği Llama 4 Behemoth modeli de var. Meta CEO'su Mark Zuckerberg, bu versiyonun "dünyanın en yüksek performanslı temel modeli" olduğunu savundu.
Meta'ya göre, Llama 4 Scout 10 milyon token'lık bir bağlam penceresine (bir yapay zekanın çalışma belleği) sahip ve Google'ın Gemma 3 ve Gemini 2.0 Flash-Lite modellerini ve açık kaynaklı Mistral 3.1'i "çok sayıda yaygın benchmark testinde" geride bırakıyor. Üstelik bu performansı tek bir Nvidia H100 GPU ile sağlıyor.
Meta, benzer şekilde daha büyük Maverick modelinin de OpenAI'ın GPT-4o ve Google'ın Gemini 2.0 Flash modellerinden daha iyi performans gösterdiğini ve DeepSeek-V3 ile karşılaştırıldığında kodlama ve akıl yürütme görevlerinde benzer sonuçlar verdiğini, ancak bunu "yarısından az aktif parametre" ile başardığını söylüyor.
Öte yandan henüz yayınlanmayan Llama 4 Behemoth, 288 milyar aktif parametreye ve toplamda 2 trilyon parametreye sahip. Meta, Behemoth'un bazı STEM benchmark testlerinde, rakipleri GPT-4.5 ve Claude Sonnet 3.7'yi geride bırakabildiğini belirtiyor.
Llama 4 modellerinde Meta, yalnızca görev için gerekli model parçalarının çalıştırıldığı "mixture of experts" (MoE) adlı mimariye geçtiğini söylüyor. Bu yöntem, kaynak kullanımını daha verimli hale getiriyor. Şirket, yapay zeka modelleri ve ürünleriyle ilgili gelecekteki planlarını 29 Nisan'da gerçekleşecek LlamaCon konferansında açıklamayı planlıyor.
Geçmiş modellerinde olduğu gibi Meta, Llama 4 koleksiyonunu da "açık kaynak" olarak nitelendiriyor. Ancak Llama, lisans kısıtlamaları nedeniyle bu konuda eleştiriliyor. Örneğin Llama 4 lisansı, aylık 700 milyonun üzerinde aktif kullanıcısı olan ticari şirketlerin Meta'dan izin almasını şart koşuyor.
Bu durum, Açık Kaynak Girişimi'nin (Open Source Initiative) 2023'te belirttiğine göre, Llama modellerini "gerçek anlamda açık kaynak" kategorisinin dışına çıkarıyor.