Google Genie 2 介紹
Genie 2 是 Google DeepMind 的基礎世界模型,可以從單個圖像提示生成無限多樣的可動作控制、可玩的 3D 環境,用於訓練和評估 AI 代理。
查看更多什麼是 Google Genie 2
Genie 2 是由 Google DeepMind 開發的突破性 AI 模型,代表了生成互動 3D 虛擬環境的重大進步。作為專注於 2D 世界的 Genie 1 的繼任者,Genie 2 可以根據單個提示圖像創建豐富、多樣且完全可玩的 3D 環境。該模型使人類和 AI 代理能夠使用標準鍵盤和鼠標輸入與這些生成的環境進行互動,維持長達 60 秒的遊戲時間,同時展示出在物理、對象互動、角色動畫和 NPC 行為模擬方面的複雜能力。
Google Genie 2 如何運作?
Genie 2 作為一個自迴歸潛在擴散模型,經過大量視頻數據集的訓練。該過程從一個圖像提示開始(可以是由 Imagen 3 生成的圖像或真實照片),定義所需的環境。系統首先將輸入通過自動編碼器,然後使用類似於語言模型的因果掩碼的大變壓器模型處理潛在幀。在推理過程中,Genie 2 以自迴歸方式逐幀生成環境,考慮過去的幀和用戶動作,並使用無分類器引導來提高動作可控制性。該模型展示了令人驚訝的能力,包括長期記憶(記住屏幕外的元素)、物理模擬、照明效果和複雜的角色動畫。
Google Genie 2 的好處
Genie 2 的主要優點在於它能夠通過為具身代理提供無限多樣的訓練環境來加速 AI 研究。它使快速原型設計互動體驗成為可能,而無需傳統的遊戲開發資源,讓研究人員和設計師能夠快速試驗新環境。該系統能夠處理各種輸入類型(從概念藝術到真實照片),使其成為創意工作流程中的寶貴工具。此外,其生成一致且物理感知的 3D 環境的能力為在多樣化場景中測試和評估 AI 代理開闢了新的可能性,可能加速向更通用的 AI 系統的進步。
Google Genie 2 每月流量趨勢
Google Genie 2 在十二月份達到了460萬次訪問量,增長率達233.7%。Gemini 2.0版本推出了擴展的多模態功能,包括圖像和音頻生成,這顯著提升了用戶參與度。此外,Genie 2能夠生成各種可玩的3D世界,進一步推動了用戶興趣和流量。
查看歷史流量
查看更多