Google Genie 2 Introduction
Genie 2 adalah model dunia dasar Google DeepMind yang dapat menghasilkan berbagai variasi lingkungan 3D yang dapat dikendalikan aksi dan dapat dimainkan dari satu gambar prompt untuk pelatihan dan evaluasi agen AI.
Lihat Lebih BanyakApa itu Google Genie 2
Genie 2 adalah model AI terobosan yang dikembangkan oleh Google DeepMind yang mewakili kemajuan signifikan dalam menghasilkan lingkungan virtual 3D interaktif. Sebagai penerus Genie 1 yang berfokus pada dunia 2D, Genie 2 dapat membuat lingkungan 3D yang kaya, beragam, dan sepenuhnya dapat dimainkan berdasarkan satu gambar prompt. Model ini memungkinkan baik manusia maupun agen AI untuk berinteraksi dengan lingkungan yang dihasilkan ini menggunakan input keyboard dan mouse standar, mempertahankan konsistensi selama hingga 60 detik permainan sambil menunjukkan kemampuan canggih dalam fisika, interaksi objek, animasi karakter, dan simulasi perilaku NPC.
Bagaimana cara kerja Google Genie 2?
Genie 2 beroperasi sebagai model difusi laten autoregresif yang dilatih pada dataset video besar. Proses dimulai dengan gambar prompt (yang dapat dihasilkan oleh Imagen 3 atau merupakan foto nyata) yang mendefinisikan lingkungan yang diinginkan. Sistem ini pertama-tama melewatkan input melalui autoencoder, kemudian memproses frame laten menggunakan model transformer besar dengan masker kausal yang mirip dengan model bahasa. Selama inferensi, Genie 2 menghasilkan lingkungan frame demi frame dengan cara autoregresif, mempertimbangkan frame sebelumnya dan tindakan pengguna sambil menggunakan panduan tanpa klasifikasi untuk meningkatkan kendali tindakan. Model ini menunjukkan kemampuan luar biasa termasuk memori jangka panjang (mengingat elemen di luar layar), simulasi fisika, efek pencahayaan, dan animasi karakter yang kompleks.
Manfaat dari Google Genie 2
Manfaat utama dari Genie 2 terletak pada kemampuannya untuk mempercepat penelitian AI dengan menyediakan lingkungan pelatihan yang beragam dan tidak terbatas untuk agen yang terwujud. Ini memungkinkan prototyping cepat pengalaman interaktif tanpa perlu sumber daya pengembangan game tradisional, memungkinkan peneliti dan desainer untuk dengan cepat bereksperimen dengan lingkungan baru. Kemampuan sistem untuk bekerja dengan berbagai jenis input - dari seni konsep hingga foto nyata - menjadikannya alat yang berharga untuk alur kerja kreatif. Selain itu, kemampuannya untuk menghasilkan lingkungan 3D yang konsisten dan sadar fisika membuka kemungkinan baru untuk menguji dan mengevaluasi agen AI dalam berbagai skenario, berpotensi mempercepat kemajuan menuju sistem AI yang lebih umum.
Tren Traffic Bulanan Google Genie 2
Google Genie 2 mencapai 4,6 juta kunjungan dengan pertumbuhan 233,7% pada bulan Desember. Peluncuran Gemini 2.0 memperkenalkan kemampuan multimodal yang diperluas, termasuk pembuatan gambar dan audio, yang secara signifikan meningkatkan keterlibatan pengguna. Selain itu, Genie 2 dapat menghasilkan berbagai dunia 3D yang dapat dimainkan, semakin mendorong minat dan lalu lintas pengunjung.
Lihat riwayat traffic
Lihat Selengkapnya