Google Genie 2 Como Fazer
O Genie 2 é o modelo de mundo fundamental da Google DeepMind que pode gerar infinitas variedades de ambientes 3D jogáveis e controláveis por ação a partir de um único prompt de imagem para treinamento e avaliação de agentes de IA.
Ver MaisComo Usar o Google Genie 2
Nota: Genie 2 não está disponível publicamente: Com base nas fontes, o Genie 2 é um modelo de pesquisa da Google DeepMind que atualmente não está liberado para uso público. Ele está sendo usado internamente para pesquisa e desenvolvimento de IA.
Insira um prompt de imagem: Se você tivesse acesso, começaria fornecendo um único prompt de imagem (gerado pelo Imagen 3 ou uma foto real) para definir o ambiente virtual que deseja criar.
Aguarde a geração do ambiente: O Genie 2 processaria o prompt de imagem e geraria um ambiente 3D interativo com base nele. Este ambiente pode durar até 60 segundos, com a maioria dos exemplos durando de 10 a 20 segundos.
Controle com teclado/mouse: Uma vez que o ambiente é gerado, você pode controlar o movimento e as interações usando entradas padrão de teclado e mouse. O modelo reconhece quais elementos devem ser controláveis (como personagens) em comparação com elementos estáticos (como árvores).
Explore o ambiente: Você pode se mover, interagir com objetos e explorar o mundo gerado. O modelo mantém a consistência e se lembra de áreas mesmo quando não estão à vista.
Opcional: Implante agentes de IA: Para fins de pesquisa, agentes de IA como o SIMA podem ser implantados para interagir e navegar pelos ambientes gerados seguindo instruções em linguagem natural.
Perguntas Frequentes do Google Genie 2
Genie 2 é um modelo de mundo de fundação desenvolvido pela Google DeepMind que pode gerar uma infinidade de ambientes 3D jogáveis e controláveis por ação com base em uma única imagem de prompt. Pode ser jogado tanto por humanos quanto por agentes de IA usando entradas de teclado e mouse.
Tendências de Tráfego Mensal do Google Genie 2
O Google Genie 2 alcançou 4,6 milhões de visitas com um crescimento de 233,7% em dezembro. O lançamento do Gemini 2.0 introduziu recursos multimodais expandidos, incluindo geração de imagem e áudio, o que aumentou significativamente o engajamento dos usuários. Além disso, o Genie 2 pode gerar uma grande variedade de mundos 3D jogáveis, impulsionando ainda mais o interesse e o tráfego.
Ver histórico de tráfego
Ver Mais