Google Genie 2 使用方法
Genie 2 是 Google DeepMind 的基础世界模型,可以从单个图像提示生成无限多样的、可操作的、可玩的 3D 环境,用于训练和评估 AI 代理。
查看更多如何使用 Google Genie 2
注意:Genie 2 尚未公开发布: 根据资料,Genie 2 是 Google DeepMind 的研究模型,目前尚未公开发布。它正在内部用于 AI 研究和开发。
输入图像提示: 如果有访问权限,您将首先提供一个单个图像提示(可以是由 Imagen 3 生成的或真实照片),以定义您想要创建的虚拟环境。
等待环境生成: Genie 2 将处理图像提示并生成一个基于该提示的交互式 3D 环境。该环境可以持续长达 60 秒,大多数示例持续 10-20 秒。
使用键盘/鼠标控制: 环境生成后,您可以使用标准的键盘和鼠标输入控制移动和交互。模型识别哪些元素应该是可控制的(如角色)与静态元素(如树木)。
探索环境: 您可以移动、与对象交互并探索生成的世界。模型保持一致性和记忆不在视野中的区域。
可选:部署 AI 代理: 出于研究目的,可以部署像 SIMA 这样的 AI 代理,根据自然语言指令与生成的环境进行交互和导航。
Google Genie 2 常见问题
Genie 2 是由 Google DeepMind 开发的基础世界模型,可以根据单个提示图像生成无限多样的可操作、可玩的 3D 环境。它可以通过键盘和鼠标输入由人类和 AI 代理操作。
Google Genie 2 月度流量趋势
Google Genie 2 的流量增长了12.3%,达到430万次访问。这一增长归功于Gemini 2.5的发布,它提供了增强的推理和代码功能,以及在Gemini应用程序中推出的Veo 2,为高级用户提供了新的多模态视频生成功能。
查看历史流量
查看更多