Google Genie 2 Giriş
Genie 2, AI ajanlarını eğitmek ve değerlendirmek için tek bir görüntü isteminden sonsuz çeşitlilikte eylem kontrol edilebilir, oynanabilir 3D ortamlar oluşturabilen Google DeepMind'in temel dünya modelidir.
Daha Fazla GösterGoogle Genie 2 Nedir
Genie 2, Google DeepMind tarafından geliştirilen ve etkileşimli 3D sanal ortamlar oluşturmadaki önemli bir ilerlemeyi temsil eden bir AI modelidir. 2D dünyalara odaklanan Genie 1'in halefidir ve Genie 2, tek bir istem görüntüsüne dayalı olarak zengin, çeşitli ve tamamen oynanabilir 3D ortamlar oluşturabilir. Model, hem insanların hem de AI ajanlarının bu üretilen ortamlarla standart klavye ve fare girişleri kullanarak etkileşimde bulunmasını sağlar, oyun süresi boyunca 60 saniyeye kadar tutarlılığı korurken, fizik, nesne etkileşimleri, karakter animasyonu ve NPC davranış simülasyonu konularında karmaşık yetenekler sergiler.
Google Genie 2 nasıl çalışır?
Genie 2, büyük bir video veri seti üzerinde eğitilmiş bir otoregresif latent difüzyon modeli olarak çalışır. Süreç, istenen ortamı tanımlayan bir görüntü istemi ile başlar (bu, Imagen 3 tarafından üretilmiş veya gerçek bir fotoğraf olabilir). Sistem önce girişi bir autoencoder'dan geçirir, ardından latent kareleri, dil modellerine benzer bir nedensel maske ile büyük bir transformer modeli kullanarak işler. Çıkarım sırasında, Genie 2, geçmiş kareleri ve kullanıcı eylemlerini dikkate alarak otoregresif bir şekilde ortamı kare kare oluşturur ve eylem kontrol edilebilirliğini artırmak için sınıflandırıcıdan bağımsız rehberlik kullanır. Model, uzun süreli bellek (ekran dışı unsurları hatırlama), fizik simülasyonu, aydınlatma efektleri ve karmaşık karakter animasyonları dahil olmak üzere dikkate değer yetenekler sergiler.
Google Genie 2 Faydaları
Genie 2'nin temel avantajı, bedenlenmiş ajanlar için sınırsız çeşitli eğitim ortamları sağlayarak AI araştırmalarını hızlandırma yeteneğindedir. Geleneksel oyun geliştirme kaynaklarına ihtiyaç duymadan etkileşimli deneyimlerin hızlı prototiplenmesini sağlar, bu da araştırmacıların ve tasarımcıların yeni ortamlarla hızlı bir şekilde denemeler yapmasına olanak tanır. Sistemin, kavramsal sanat eserlerinden gerçek fotoğraflara kadar çeşitli giriş türleriyle çalışma yeteneği, onu yaratıcı iş akışları için değerli bir araç haline getirir. Ayrıca, tutarlı, fizik bilgisine sahip 3D ortamlar oluşturma yeteneği, AI ajanlarını çeşitli senaryolarda test etme ve değerlendirme için yeni olanaklar sunar ve bu da daha genel AI sistemlerine doğru ilerlemeyi hızlandırabilir.
Google Genie 2 Aylık Trafik Trendleri
Google Genie 2, Aralık ayında 4.6M ziyaret ve %233.7 büyüme elde etti. Gemini 2.0 sürümü, görüntü ve ses üretimi dahil olmak üzere genişletilmiş çoklu ortam yetenekleri sunarak kullanıcı etkileşimini önemli ölçüde artırdı. Ayrıca, Genie 2 oynanabilir çok çeşitli 3D dünyalar oluşturabilmekte, bu da ilgiyi ve trafiği daha da artırmaktadır.
Geçmiş trafiği görüntüle
Daha Fazla Göster