Teknoloji devi Apple, kullanıcıların fotoğraf düzenleme uygulamalarına hiç ihtiyaç duymadan sadece metin komutları yazarak bir fotoğrafta istedikleri değişikliği yapabilecekleri yeni yapay zeka modelini piyasaya sürdü.
Apple ile Kaliforniya Üniversitesi iş birliğiyle geliştirildiği belirtilen MGIE, multimodal (çok modlu) büyük dil modeli (MLLM) teknolojisiyle çalışıyor. Metin komutları aracılığıyla görselleri kırpabiliyor, yeniden boyutlandırabiliyor, çevirebiliyor ve filtreler ekleyebiliyor.
"MLLM Kılavuzlu Görüntü Düzenleme" anlamına gelen MGIE'nin, bir fotoğraftaki belirli nesneleri farklı bir şekle sokmak ya da daha parlak hale getirmek için değiştirmek gibi basit ve karmaşık görüntü düzenleme işlemlerini saniyeler içinde gerçekleştirebildiği belirtiliyor.
Çok modlu dil modellerinin iki farklı kullanımının "harmanlanarak" kullanıcılara sunulduğu MGIE, ilk olarak kullanıcı istemlerinin nasıl yorumlanacağını öğreniyor. Daha sonra düzenlemenin nasıl görüneceğini "hayal ederek" çalışıyor.
Küçük bir örnek vermek gerekirse, bir fotoğraftaki gökyüzünün daha mavi olmasını istediğiniz zaman, uygulama görüntüdeki gökyüzünün mavi kısmının parlaklığını otomatik olarak artırıyor.
MGIE ile bir fotoğrafı düzenlerken, kullanıcıların resimde neyi değiştirmek istediklerini yazmaları yeterli oluyor. Apple'ın uygulamanın kullanımını açıklamak için paylaştığı makalede biberli pizza görselinin düzenlenmesi örneği kullanıldı. "Daha sağlıklı hale getirin" komutu yazıldığında, pizza görseline sebze sosları eklendi.
VentureBeat'in haberine göre Apple, MGIE'yi GitHub üzerinden indirilebilir hale getirdi ve aynı zamanda da Hugging Face Spaces'ta bir web demosu yayınladı. Şirket, modele yönelik gelecekteki planlarını ise açıklamadı.
OpenAI'nin DALL-E 3'ü gibi bazı görüntü oluşturma platformları, metin komutları yoluyla oluşturulan fotoğraflar üzerinde basit düzenleme görevlerini gerçekleştirebiliyor. Çoğu kişinin görüntü düzenleme için başvurduğu Photoshop'un sahibi olan Adobe'nin de kendi AI düzenleme modeli bulunuyor.
Apple CEO'su Tim Cook, şirketin bu yıl cihazlarına daha fazla yapay zeka özelliği eklemek istediğini söylemişti. Aralık ayında Apple araştırmacıları, yapay zeka modellerinin Apple Silicon çipleri üzerinde eğitilmesini kolaylaştırmak için MLX adında açık kaynaklı bir "makine öğrenimi çerçevesi" yayınlamıştı.