Google Genie 2 Howto
Genie 2 adalah model dunia dasar Google DeepMind yang dapat menghasilkan berbagai variasi lingkungan 3D yang dapat dikendalikan aksi dan dapat dimainkan dari satu gambar prompt untuk pelatihan dan evaluasi agen AI.
Lihat Lebih BanyakCara Menggunakan Google Genie 2
Catatan: Genie 2 tidak tersedia untuk umum: Berdasarkan sumber, Genie 2 adalah model penelitian oleh Google DeepMind yang saat ini tidak dirilis untuk penggunaan publik. Ini digunakan secara internal untuk penelitian dan pengembangan AI.
Masukkan gambar prompt: Jika Anda memiliki akses, Anda akan mulai dengan memberikan satu gambar prompt (baik yang dihasilkan oleh Imagen 3 atau foto nyata) untuk mendefinisikan lingkungan virtual yang ingin Anda buat.
Tunggu untuk menghasilkan lingkungan: Genie 2 akan memproses gambar prompt dan menghasilkan lingkungan 3D interaktif berdasarkan itu. Lingkungan ini dapat bertahan hingga 60 detik, dengan sebagian besar contoh bertahan 10-20 detik.
Kontrol dengan keyboard/mouse: Setelah lingkungan dihasilkan, Anda dapat mengontrol gerakan dan interaksi menggunakan input keyboard dan mouse standar. Model ini mengenali elemen mana yang harus dapat dikendalikan (seperti karakter) dibandingkan dengan elemen statis (seperti pohon).
Jelajahi lingkungan: Anda dapat bergerak, berinteraksi dengan objek, dan menjelajahi dunia yang dihasilkan. Model ini mempertahankan konsistensi dan mengingat area bahkan ketika mereka tidak terlihat.
Opsional: Terapkan agen AI: Untuk tujuan penelitian, agen AI seperti SIMA dapat diterapkan untuk berinteraksi dengan dan menavigasi lingkungan yang dihasilkan mengikuti instruksi bahasa alami.
FAQ Google Genie 2
Genie 2 adalah model dunia dasar yang dikembangkan oleh Google DeepMind yang dapat menghasilkan berbagai lingkungan 3D yang dapat dikendalikan dan dimainkan berdasarkan gambar prompt tunggal. Ini dapat dimainkan oleh manusia dan agen AI menggunakan input keyboard dan mouse.
Tren Traffic Bulanan Google Genie 2
Google Genie 2 mencapai 4,6 juta kunjungan dengan pertumbuhan 233,7% pada bulan Desember. Peluncuran Gemini 2.0 memperkenalkan kemampuan multimodal yang diperluas, termasuk pembuatan gambar dan audio, yang secara signifikan meningkatkan keterlibatan pengguna. Selain itu, Genie 2 dapat menghasilkan berbagai dunia 3D yang dapat dimainkan, semakin mendorong minat dan lalu lintas pengunjung.
Lihat riwayat traffic
Lihat Selengkapnya