Google Genie 2 使い方
Genie 2は、AIエージェントのトレーニングと評価のために、単一の画像プロンプトから無限のバリエーションのアクション制御可能なプレイ可能な3D環境を生成できるGoogle DeepMindの基盤世界モデルです。
もっと見るGoogle Genie 2の使い方
注意: Genie 2は一般には利用できません: 情報源に基づくと、Genie 2は現在一般使用のためにリリースされていないGoogle DeepMindの研究モデルです。AI研究と開発のために内部で使用されています。
画像プロンプトを入力する: アクセスがあれば、作成したい仮想環境を定義するために、単一の画像プロンプト(Imagen 3によって生成されたものまたは実際の写真)を提供することから始めます。
環境生成を待つ: Genie 2は画像プロンプトを処理し、それに基づいてインタラクティブな3D環境を生成します。この環境は最大60秒間持続し、ほとんどの例は10〜20秒持続します。
キーボード/マウスで操作する: 環境が生成されたら、標準のキーボードとマウス入力を使用して移動と相互作用を制御できます。このモデルは、制御可能な要素(キャラクターなど)と静的要素(木など)を認識します。
環境を探索する: 周囲を移動したり、オブジェクトと対話したり、生成された世界を探索したりできます。このモデルは一貫性を維持し、視界にないエリアも記憶します。
オプション: AIエージェントを展開する: 研究目的のために、SIMAのようなAIエージェントを展開して、自然言語の指示に従って生成された環境と対話し、ナビゲートさせることができます。
Google Genie 2のよくある質問
Genie 2は、Google DeepMindによって開発された基盤世界モデルであり、単一のプロンプト画像に基づいて、無限の種類のアクション制御可能でプレイ可能な3D環境を生成できます。これは、キーボードとマウス入力を使用して人間とAIエージェントの両方がプレイできます。
Google Genie 2 の月間トラフィック傾向
Google Genie 2は12月に460万回のアクセスを達成し、233.7%の成長を記録しました。Gemini 2.0のリリースでは、画像や音声の生成を含むマルチモーダル機能が拡張され、ユーザーエンゲージメントが大幅に向上しました。さらに、Genie 2はプレイ可能な多様な3D世界を生成することができ、関心とトラフィックを一層促進しています。
過去のトラフィックを表示
もっと見る