Google Genie 2 功能
Genie 2 是 Google DeepMind 的基礎世界模型,可以從單個圖像提示生成無限多樣的可動作控制、可玩的 3D 環境,用於訓練和評估 AI 代理。
查看更多Google Genie 2 的主要功能
Google Genie 2 是一個大型的基礎世界模型,能夠從單張圖像提示生成可互動、可控制動作的 3D 環境。它可以創建多樣化的虛擬世界,響應鍵盤和鼠標輸入,最多可維持 60 秒的一致性,同時展示出高級的物理模擬、角色動畫、物件互動和 NPC 行為預測能力。該模型通過自動回歸潛在擴散模型處理提示,可以使用 AI 生成的和真實世界的圖像。
互動環境生成: 從單張圖像提示生成可玩的 3D 環境,響應鍵盤和鼠標輸入,最多可維持 60 秒的一致性
高級物理和動畫: 模擬複雜的物理現象,包括重力、水效應、煙霧、照明和反射,以及精緻的角色動畫和物件互動
長期記憶和一致性: 能夠記住並準確渲染之前查看過的環境部分,當它們重新進入視野時
多視角生成: 支持多種視角,包括第一人稱、第三人稱和等距視圖,使其適用於不同類型的虛擬體驗
Google Genie 2 的使用案例
AI 代理訓練: 為各種場景中的 AI 代理提供多樣化的虛擬環境,無需手動創建環境即可進行訓練和評估
遊戲原型設計: 使開發者和設計師能夠快速原型化遊戲環境和機制,加速創意過程
互動內容創作: 使創作者能夠從概念圖或照片快速生成互動 3D 環境,適用於各種應用
優點
在生成多樣化 3D 環境方面高度靈活
只需單張圖像即可生成複雜的互動世界
展示出高級的物理和動畫能力
缺點
最多只能生成 60 秒的一致世界
需要模型蒸餾以實現實時性能,但會降低質量
仍處於早期研究階段,一般性和一致性方面有改進空間
Google Genie 2 每月流量趨勢
Google Genie 2 在十二月份達到了460萬次訪問量,增長率達233.7%。Gemini 2.0版本推出了擴展的多模態功能,包括圖像和音頻生成,這顯著提升了用戶參與度。此外,Genie 2能夠生成各種可玩的3D世界,進一步推動了用戶興趣和流量。
查看歷史流量
查看更多