Google Genie 2 功能

WebsiteContact for PricingAI 3D Model Generator

Genie 2 是 Google DeepMind 的基础世界模型，可以从单个图像提示生成无限多样的、可操作的、可玩的 3D 环境，用于训练和评估 AI 代理。

Google Genie 2 的主要功能

Google Genie 2 是一个大规模的基础世界模型，能够从单张图像提示生成可交互、可控制动作的 3D 环境。它可以创建响应键盘和鼠标输入的多样化虚拟世界，保持长达 60 秒的一致性，同时展示出高级的物理模拟、角色动画、对象交互和 NPC 行为预测能力。该模型通过自回归潜在扩散模型处理提示，并可以使用 AI 生成的和真实世界的图像。

互动环境生成: 从单张图像提示创建可玩的 3D 环境，响应键盘和鼠标输入，能够保持长达 60 秒的一致性

高级物理和动画: 模拟复杂的物理现象，包括重力、水效果、烟雾、光照和反射，以及复杂的角色动画和对象交互

长期记忆和一致性: 能够在重新进入视野时记住并准确渲染之前查看过的环境部分

多视角生成: 支持多种视角，包括第一人称、第三人称和等距视图，使其适用于不同类型的虚拟体验

Google Genie 2 的使用场景

AI 代理训练: 为在各种场景中训练和评估 AI 代理提供多样化的虚拟环境，无需手动创建环境

游戏原型设计: 使开发者和设计师能够快速原型化游戏环境和机制，加速创意过程

互动内容创作: 允许创作者从概念艺术或照片快速生成互动 3D 环境，用于各种应用

优点

生成多样化的 3D 环境非常灵活

仅需单张图像即可创建复杂的互动世界

展示出高级的物理和动画能力

缺点

最长一致世界生成时间为 60 秒

需要模型蒸馏以实现实时性能，但会降低质量

仍处于早期研究阶段，通用性和一致性有改进空间

Google Genie 2 月度流量趋势

Google Genie 2 实现了1120万访问量，流量增长162.8%。这显著的增长很可能是由于Veo 3的发布，该版本增强了视频和音频生成功能，以及功能强大的视频创作工具Flow的推出。此外，包含高级推理和工具集成的Gemini 2.5更新可能也吸引了更多用户。

查看历史流量