Elon Musk'ın yapay zeka şirketi xAI, OpenAI'ın GPT-4o ve Google'ın Gemini modellerine rakip olarak geliştirdiği Grok 3 yapay zeka modelini duyurdu. 200 bin GPU ile eğitilen ve önceki versiyonlarına kıyasla 10 kat daha fazla hesaplama gücüne sahip olan Grok 3, genişletilmiş veri seti sayesinde daha gelişmiş akıl yürütme yetenekleri sunuyor. Yeni model, matematik ve bilim testlerinde GPT-4o'yu geride bırakırken, Grok 3 Reasoning ve Grok 3 Mini gibi farklı versiyonlarıyla dikkat çekiyor. İşte Grok 3 özellikleri ve tüm detaylar.
Elon Musk'ın yapay zeka şirketi xAI, en yeni amiral gemisi modelini Grok 3 adıyla piyasaya sürdü ve Grok'un iOS ve web uygulamaları için yeni yetenekler tanıttı.
OpenAI'ın GPT-4o ve Google'ın Gemini gibi modellerine xAI'ın cevabı olan Grok, görselleri analiz edebiliyor, sorulara yanıt verebiliyor ve Musk'ın sosyal ağı X'te çeşitli özellikleri destekliyor. Birkaç aydır geliştirilmekte olan Grok 3'ün 2024'te piyasaya sürülmesi planlanıyordu, ancak bu hedefe ulaşılamadı.
xAI, Grok 3'ü eğitmek için Memphis'te bulunan yaklaşık 200 bin GPU'luk devasa bir veri merkezini kullanıyor. Musk, X'te yaptığı bir paylaşımda Grok 3'ün, selefi Grok 2'ye kıyasla "10 kat" daha fazla hesaplama gücüyle geliştirildiğini ve mahkeme dosyalarını da içeren genişletilmiş bir eğitim veri setine dayandığını belirtti.
Grok 3'ü "dünyanın en akıllı yapay zekası" olarak tanımlayan Musk, "(Bu) maksimum düzeyde gerçeklik arayan bir yapay zekadır, hatta bazen bu gerçekler politik olarak doğru olanla çelişse bile" ifadelerini kullandı.
Grok 3, aslında bir model ailesi. Tıpkı OpenAI'ın o3 ve o3-mini olmak üzere iki ayrı versiyonu olduğu gibi, Grok 3'ün de sorulara daha hızlı cevap verebilen bir mini modeli mevcut. Ancak Grok 3 ailesindeki tüm modeller ve ilgili özellikler henüz kullanıma sunulmadı. Bazı özellikler hâlâ beta aşamasında olsa da pazartesi günü itibarıyla kullanıma sunulmaya başladı.
xAI, Grok 3'ün AIME (matematik sorularındaki performansı değerlendiren bir test) ve GPQA (doktora seviyesinde fizik, biyoloji ve kimya problemlerini değerlendiren bir test) gibi kıyaslamalarda GPT-4o'yu geçtiğini iddia ediyor.
Ayrıca Grok 3'ün erken bir versiyonunun, farklı yapay zeka modellerini birbirleriyle karşı karşıya getiren ve kullanıcıların tercih ettikleri yanıtları oylamalarını sağlayan kitle kaynaklı bir test olan Chatbot Arena'da da rekabetçi bir sıralama elde ettiği belirtildi.
Grok 3 ailesindeki iki model, Grok 3 Reasoning (Akıl Yürütme) ve Grok 3 mini Reasoning, problemlere daha dikkatli düşünerek yaklaşabiliyor. Bu, sonuçları paylaşmadan önce kendi doğruluklarını kontrol etmeye çalıştıkları anlamına geliyor.
xAI'a göre Grok 3 Reasoning modeli, o3-mini'nin en iyi versiyonu olan o3-mini-high sürümünü, AIME 2025 adlı yeni bir matematik kıyaslaması da dahil olmak üzere birçok popüler testte geride bıraktı.
Akıl yürütme modellerine Grok uygulaması üzerinden erişilebiliyor. Kullanıcılar Grok 3'ten "Düşünmesini" isteyebilir veya daha zor sorgular için ek bilgi işlem kullanan akıl yürütme için "Büyük Beyin" modundan yararlanabilirler.
X'in Premium+ katmanına (aylık 667 TL) abone olanlar ilk olarak Grok 3'e erişebilecek ve diğer özellikler xAI'ın SuperGrok adını verdiği yeni bir planın arkasında yer alacak. Aylık 30 dolar ya da yıllık 300 dolar olarak fiyatlandırılan SuperGrok, ek akıl yürütme ve DeepSearch sorgularının kilidini açıyor ve sınırsız görüntü oluşturmayı da beraberinde getiriyor.
Elon Musk, Grok'un akıl yürütme modellerinin bazı "düşüncelerinin" kasıtlı olarak gizlendiğini söyledi. Bunun nedeni, AI model geliştiricilerinin diğer modellerin bilgisini çıkarmak için kullandığı "distillation" (bilgi damıtma) yöntemine karşı korunmak. Son zamanlarda DeepSeek, OpenAI'ın modellerini damıtarak kendi yapay zekasını geliştirmekle suçlanmıştı.