Google Genie 2 特徴
Genie 2は、AIエージェントのトレーニングと評価のために、単一の画像プロンプトから無限のバリエーションのアクション制御可能なプレイ可能な3D環境を生成できるGoogle DeepMindの基盤世界モデルです。
もっと見るGoogle Genie 2の主な機能
Google Genie 2は、単一の画像プロンプトからインタラクティブでアクション制御可能な3D環境を生成できる大規模な基盤世界モデルです。キーボードやマウスの入力に応じて反応する多様な仮想世界を作成でき、最大60秒間の一貫性を維持しながら、物理シミュレーション、キャラクターアニメーション、オブジェクトインタラクション、NPC行動予測における高度な能力を示します。このモデルは、自己回帰型潜在拡散モデルを通じてプロンプトを処理することによって機能し、AI生成画像と実世界の画像の両方で使用できます。
インタラクティブ環境生成: キーボードやマウスの入力に応じて反応する単一の画像プロンプトからプレイ可能な3D環境を生成し、最大60秒間の一貫性を維持する能力があります
高度な物理とアニメーション: 重力、水の効果、煙、照明、反射を含む複雑な物理をモデル化し、洗練されたキャラクターアニメーションとオブジェクトインタラクションを提供します
長期記憶と一貫性: 環境の以前に見た部分を思い出し、視界に戻ったときに正確にレンダリングする能力があります
多視点生成: 一人称、三人称、アイソメトリックビューなど、さまざまな視点をサポートし、異なるタイプの仮想体験に対応できる柔軟性を持っています
Google Genie 2のユースケース
AIエージェントトレーニング: 手動で作成された環境を必要とせず、さまざまなシナリオでAIエージェントをトレーニングおよび評価するための多様な仮想環境を提供します
ゲームプロトタイピング: 開発者やデザイナーのためにゲーム環境やメカニクスの迅速なプロトタイピングを可能にし、創造的なプロセスを加速します
インタラクティブコンテンツ作成: さまざまなアプリケーションのために、コンセプトアートや写真からインタラクティブな3D環境を迅速に生成できるようにします
メリット
多様な3D環境を生成するのに非常に柔軟性がある
複雑なインタラクティブな世界を作成するために最小限の入力(単一の画像)を必要とする
高度な物理およびアニメーション機能を示す
デメリット
最大60秒の一貫した世界生成に制限される
リアルタイム性能のためにモデルの蒸留が必要で、品質が低下する
一般性と一貫性の改善の余地がある初期研究段階にある
Google Genie 2 の月間トラフィック傾向
Google Genie 2は12月に460万回のアクセスを達成し、233.7%の成長を記録しました。Gemini 2.0のリリースでは、画像や音声の生成を含むマルチモーダル機能が拡張され、ユーザーエンゲージメントが大幅に向上しました。さらに、Genie 2はプレイ可能な多様な3D世界を生成することができ、関心とトラフィックを一層促進しています。
過去のトラフィックを表示
もっと見る