Google Genie 2
Genie 2 是 Google DeepMind 的基礎世界模型,可以從單個圖像提示生成無限多樣的可動作控制、可玩的 3D 環境,用於訓練和評估 AI 代理。
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model?ref=aipure&utm_source=aipure
產品資訊
更新時間:2024年12月16日
Google Genie 2 每月流量趨勢
Google Genie 2 的流量下降了17.9%,訪問量為138萬次。最近缺乏重大產品更新或新功能的消息可能導致了這種下降。此外,Google DeepMind 推出的具有先進多模態功能的Gemini 2.0,可能分散了用戶的注意力。
什麼是 Google Genie 2
Genie 2 是由 Google DeepMind 開發的突破性 AI 模型,代表了生成互動 3D 虛擬環境的重大進步。作為專注於 2D 世界的 Genie 1 的繼任者,Genie 2 可以根據單個提示圖像創建豐富、多樣且完全可玩的 3D 環境。該模型使人類和 AI 代理能夠使用標準鍵盤和鼠標輸入與這些生成的環境進行互動,維持長達 60 秒的遊戲時間,同時展示出在物理、對象互動、角色動畫和 NPC 行為模擬方面的複雜能力。
Google Genie 2 的主要功能
Google Genie 2 是一個大型的基礎世界模型,能夠從單張圖像提示生成可互動、可控制動作的 3D 環境。它可以創建多樣化的虛擬世界,響應鍵盤和鼠標輸入,最多可維持 60 秒的一致性,同時展示出高級的物理模擬、角色動畫、物件互動和 NPC 行為預測能力。該模型通過自動回歸潛在擴散模型處理提示,可以使用 AI 生成的和真實世界的圖像。
互動環境生成: 從單張圖像提示生成可玩的 3D 環境,響應鍵盤和鼠標輸入,最多可維持 60 秒的一致性
高級物理和動畫: 模擬複雜的物理現象,包括重力、水效應、煙霧、照明和反射,以及精緻的角色動畫和物件互動
長期記憶和一致性: 能夠記住並準確渲染之前查看過的環境部分,當它們重新進入視野時
多視角生成: 支持多種視角,包括第一人稱、第三人稱和等距視圖,使其適用於不同類型的虛擬體驗
Google Genie 2 的使用案例
AI 代理訓練: 為各種場景中的 AI 代理提供多樣化的虛擬環境,無需手動創建環境即可進行訓練和評估
遊戲原型設計: 使開發者和設計師能夠快速原型化遊戲環境和機制,加速創意過程
互動內容創作: 使創作者能夠從概念圖或照片快速生成互動 3D 環境,適用於各種應用
優點
在生成多樣化 3D 環境方面高度靈活
只需單張圖像即可生成複雜的互動世界
展示出高級的物理和動畫能力
缺點
最多只能生成 60 秒的一致世界
需要模型蒸餾以實現實時性能,但會降低質量
仍處於早期研究階段,一般性和一致性方面有改進空間
如何使用 Google Genie 2
注意:Genie 2 尚未公開發佈: 根據資料,Genie 2 是 Google DeepMind 的研究模型,目前尚未對公眾發佈。它正在內部用於 AI 研究和開發。
輸入圖像提示: 如果獲得訪問權限,您將首先提供一個單一圖像提示(可以是由 Imagen 3 生成的圖像或真實照片),以定義您要創建的虛擬環境。
等待環境生成: Genie 2 將處理圖像提示並生成一個互動的 3D 環境。該環境可以持續長達 60 秒,大多數示例持續 10-20 秒。
使用鍵盤/鼠標控制: 一旦環境生成,您可以使用標準鍵盤和鼠標輸入控制移動和互動。該模型識別哪些元素應該可控制(如角色)與哪些元素是靜態的(如樹木)。
探索環境: 您可以移動、與對象互動並探索生成的世界。該模型保持一致性並記住即使不在視野中的區域。
可選:部署 AI 代理: 為了研究目的,可以部署像 SIMA 這樣的 AI 代理,以遵循自然語言指令與生成的環境進行互動和導航。
Google Genie 2 常見問題
Genie 2 是由 Google DeepMind 開發的一個基礎世界模型,可以根據單個提示圖像生成無限多種可操作、可遊玩的 3D 環境。它可以用鍵盤和鼠標輸入由人類和 AI 代理玩。
Google Genie 2 網站分析
Google Genie 2 流量和排名
1.4M
每月訪問量
#53382
全球排名
#113
類別排名
流量趨勢:Aug 2024-Nov 2024
Google Genie 2 用戶洞察
00:01:16
平均訪問時長
1.83
每次訪問的頁面數
59.18%
用戶跳出率
Google Genie 2 的主要地區
US: 26.82%
IN: 6.48%
GB: 5.86%
KR: 4.56%
CN: 4.26%
Others: 52.02%