
SIMA 2
SIMA 2 是 Google DeepMind 的下一代 AI 代理,由 Gemini 提供支持,它可以理解、推理並在 3D 虛擬環境中採取智能行動,同時通過文本、語音或圖像與用戶進行自然互動。
https://goo.gle/SIMA-2?ref=producthunt&utm_source=aipure

產品資訊
更新時間:2025年11月18日
什麼是 SIMA 2
SIMA 2 (Scalable Instructable Multiworld Agent 2) 是 Google DeepMind 在創建通用且有用的 AI 代理方面的最新里程碑。SIMA 2 在其前身 SIMA 的基礎上構建,SIMA 可以在虛擬環境中遵循基本指令,SIMA 2 集成了 Gemini 模型的先進功能,從一個簡單的指令追隨者演變為一個互動遊戲夥伴。它可以導航和解決各種 3D 虛擬世界中的問題,包括《無人深空》、《Valheim》和《Goat Simulator 3》等商業遊戲,同時能夠理解用戶目標、執行複雜的推理並隨著時間的推移自我完善。
SIMA 2 的主要功能
SIMA 2 是 Google DeepMind 的先進 AI 代理,它整合了 Gemini 的語言和推理能力,以便在 3D 虛擬環境中運作。它不僅僅是簡單地遵循指令,還能理解高層次的目標、執行複雜的推理,並在不同的遊戲和虛擬世界中執行動作。該代理可以通過文字、語音或圖像進行交流,從經驗中學習,並隨著時間的推移自我改進,而無需人工干預。與其前身相比,它在任務完成率方面表現出顯著的改進,並且可以有效地在全新的環境中運作,包括由 Genie 3 創建的 AI 生成世界。
Gemini 驅動的推理: 整合 Gemini 的語言模型能力,以理解上下文、計劃動作,並解釋其在虛擬環境中互動時的決策過程
多模式互動: 接受多種格式的指令,包括文字、語音、圖像,甚至表情符號,使其具有高度的可訪問性和多功能性
自我改進能力: 可以通過自我導向的遊戲和反饋來學習和提高其性能,而無需額外的人工示範
跨環境泛化: 通過轉移學習到的概念和技能,成功地在不同的遊戲和虛擬環境(包括前所未見的世界)中運作
SIMA 2 的使用案例
遊戲測試與開發: 協助開發人員在不同的場景和環境中測試遊戲,從而可能減少質量保證所需的時間和資源
機器人訓練: 作為一個平台,用於在安全、虛擬的環境中開發和測試機器人控制算法,然後再部署到物理世界中
虛擬助理開發: 為創建更強大的虛擬助理奠定基礎,這些助理可以理解上下文並在 3D 環境中執行複雜的任務
通用人工智能研究: 作為一個測試平台,用於開發和研究能夠適應新情況和環境的通用 AI 系統
優點
與 SIMA 1 相比,性能顯著提高,任務完成率更高
能夠在完全新的環境中運作,而無需事先培訓
可以通過自我導向的遊戲獨立學習和改進
缺點
在需要大量多步驟推理的非常長期的複雜任務中掙扎
互動的記憶窗口有限
在精確的低級別動作和對複雜 3D 場景的穩健視覺理解方面存在挑戰
如何使用 SIMA 2
注意:SIMA 2 尚未公開發布: 根據來源,SIMA 2 目前僅作為有限的研究預覽版提供給選定的學者和遊戲開發者。它不提供公開使用或測試。
基本互動方法: 如果可用,SIMA 2 可以通過文本、語音或在屏幕上繪製草圖來進行互動,以向 AI 代理發出指令。
遊戲環境設置: SIMA 2 的工作原理是觀察遊戲屏幕並使用虛擬鍵盤/鼠標控件,而無需訪問遊戲代碼或 API。它可以跨各種支持的遊戲工作,例如《無人深空》、《Valheim》、《Goat Simulator 3》等。
發出指令: 用戶可以提供自然語言命令或 SIMA 2 要完成的高級目標。該代理將使用 Gemini AI 來理解意圖並將其分解為可操作的步驟。
協作互動: SIMA 2 不僅僅是遵循命令,還可以進行來回對話以闡明目標、解釋其推理並描述其下一步計劃。
多語言支持: 可以使用不同的語言甚至使用表情符號發出指令,SIMA 2 可以解釋這些指令並採取適當的行動。
複雜任務執行: 用戶可以分配複雜的多步驟任務,SIMA 2 將分解它們並執行它們,同時提供有關其進度和推理的更新。
自我完善模式: 該代理可以從其經驗中學習並通過自我指導的遊戲來提高性能,儘管這似乎是一種內部訓練機制,而不是面向用戶的功能。
SIMA 2 常見問題
SIMA 2 是 Google DeepMind 的下一代 AI 代理,它整合了 Gemini 語言模型的功能,可以在 3D 虛擬世界中進行遊戲、推理和學習。它可以遵循複雜的指令、與使用者進行對話,並透過試錯來自我改進。











