Genie 2는 얼마나 오랫동안 일관된 가상 세계를 유지할 수 있나요?

Genie 2는 최대 60초 동안 일관된 가상 세계를 유지할 수 있으며, 대부분의 예시는 약 10-20초 동안 지속됩니다.

Genie 2의 주요 기능은 무엇인가요?

Genie 2의 주요 기능은 다음과 같습니다: 이미지 프롬프트에서 3D 환경 생성, 행동 제어에 대한 반응, 장기 기억 유지, 물리학 및 조명 모델링, 객체 상호작용 처리, 캐릭터 애니메이션, NPC(비플레이어 캐릭터) 시뮬레이션. 또한 실제 이미지와 함께 프롬프트로 사용할 수 있습니다.

Genie 2는 기술적으로 어떻게 작동하나요?

Genie 2는 대규모 비디오 데이터셋에 대해 훈련된 자기 회귀 잠재 확산 모델입니다. 이는 비디오에서 잠재 프레임을 처리하기 위해 자동 인코더를 사용하며, 이후 대규모 변환기 동역학 모델에 전달됩니다. 추론 시, 개별 행동과 과거 잠재 프레임을 프레임별로 고려하여 자기 회귀 방식으로 샘플링합니다.

Genie 2의 주요 목적은 무엇인가요?

Genie 2의 주요 목적은 다양한 환경에서 구현된 AI 에이전트의 훈련 및 평가를 가능하게 하고, 상호작용 경험의 신속한 프로토타이핑을 위한 도구를 제공하는 것입니다. 이는 보다 일반적인 구현된 에이전트를 개발하기 위한 제한된 훈련 환경의 병목 현상을 해결하는 데 도움을 줍니다.

Google Genie 2

WebsiteContact for PricingAI 3D Model Generator

Genie 2는 Google DeepMind의 기본 세계 모델로, 단일 이미지 프롬프트에서 무한한 종류의 행동 제어 가능하고 플레이 가능한 3D 환경을 생성하여 AI 에이전트를 훈련하고 평가할 수 있습니다.

소셜 및 이메일:

웹사이트 방문

이 도구 광고하기

https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model?ref=aipure&utm_source=aipure

개요
분석
공식 게시물
동영상
기사
대안

제품 정보

업데이트됨:Apr 15, 2026

Google Genie 2 월간 트래픽 동향

Google Genie 2는 19.2%의 트래픽 감소를 경험했으며, 이번 달에 120만 건의 방문이 줄어들었습니다. Veo 3 및 Flow와 같은 중요한 업데이트와 새로운 기능 출시가 있었음에도 불구하고, 이러한 감소는 Google DeepMind의 과학 및 의료 분야 혁신에 대한 집중적인 관심이 사용자의 주의를 분산시켰을 가능성에 기인할 수 있습니다.

과거 트래픽 보기

Google Genie 2이란?

Genie 2는 Google DeepMind에서 개발한 획기적인 AI 모델로, 상호작용하는 3D 가상 환경을 생성하는 데 있어 중요한 발전을 나타냅니다. 2D 세계에 초점을 맞춘 Genie 1의 후속 모델인 Genie 2는 단일 프롬프트 이미지를 기반으로 풍부하고 다양한 완전 플레이 가능한 3D 환경을 생성할 수 있습니다. 이 모델은 인간과 AI 에이전트가 표준 키보드 및 마우스 입력을 사용하여 생성된 환경과 상호작용할 수 있게 하며, 최대 60초의 게임 플레이 동안 일관성을 유지하면서 물리, 객체 상호작용, 캐릭터 애니메이션 및 NPC 행동 시뮬레이션에서 정교한 기능을 보여줍니다.

Google Genie 2의 주요 기능

Google Genie 2는 단일 이미지 프롬프트에서 상호작용 가능하고 행동 제어가 가능한 3D 환경을 생성할 수 있는 대규모 기초 세계 모델입니다. 키보드 및 마우스 입력에 반응하는 다양한 가상 세계를 생성할 수 있으며, 물리 시뮬레이션, 캐릭터 애니메이션, 객체 상호작용 및 NPC 행동 예측에서 고급 기능을 시연하면서 최대 60초 동안 일관성을 유지합니다. 이 모델은 자동 회귀 잠재 확산 모델을 통해 프롬프트를 처리하여 AI 생성 이미지와 실제 이미지 모두에서 사용할 수 있습니다.

상호작용 환경 생성: 키보드 및 마우스 입력에 반응하는 단일 이미지 프롬프트에서 플레이 가능한 3D 환경을 생성하며, 최대 60초 동안 일관성을 유지할 수 있는 능력을 갖추고 있습니다

고급 물리 및 애니메이션: 중력, 물 효과, 연기, 조명 및 반사를 포함한 복잡한 물리 모델링과 정교한 캐릭터 애니메이션 및 객체 상호작용을 제공합니다

장기 기억 및 일관성: 환경의 이전에 본 부분을 기억하고 정확하게 렌더링할 수 있는 능력을 갖추고 있습니다

다중 시점 생성: 1인칭, 3인칭 및 등각 뷰를 포함한 다양한 시점을 지원하여 다양한 유형의 가상 경험에 적합합니다

Google Genie 2의 사용 사례

AI 에이전트 훈련: 수동으로 생성된 환경 없이 다양한 시나리오에서 AI 에이전트를 훈련하고 평가하기 위한 다양한 가상 환경을 제공합니다

게임 프로토타이핑: 개발자와 디자이너를 위한 게임 환경 및 메커니즘의 신속한 프로토타이핑을 가능하게 하여 창의적 프로세스를 가속화합니다

상호작용 콘텐츠 생성: 창작자가 다양한 응용 프로그램을 위해 컨셉 아트나 사진에서 빠르게 상호작용 3D 환경을 생성할 수 있게 합니다

장점

다양한 3D 환경 생성에 매우 다재다능함

복잡한 상호작용 세계를 생성하기 위해 최소한의 입력(단일 이미지) 필요

고급 물리 및 애니메이션 기능을 시연함

단점

최대 60초 일관된 세계 생성으로 제한됨

품질 저하와 함께 실시간 성능을 위한 모델 증류가 필요함

아직 초기 연구 단계로 일반성과 일관성에서 개선의 여지가 있음

Google Genie 2 사용 방법

참고: Genie 2는 공개적으로 사용 가능하지 않습니다: 출처에 따르면, Genie 2는 현재 공개 사용을 위해 출시되지 않은 Google DeepMind의 연구 모델입니다. AI 연구 및 개발을 위해 내부적으로 사용되고 있습니다.

이미지 프롬프트 입력: 접근할 수 있다면, 생성할 가상 환경을 정의하기 위해 단일 이미지 프롬프트(Imagen 3에 의해 생성된 것이거나 실제 사진)를 제공하는 것으로 시작합니다.

환경 생성 대기: Genie 2는 이미지 프롬프트를 처리하고 이를 기반으로 상호작용하는 3D 환경을 생성합니다. 이 환경은 최대 60초 동안 지속될 수 있으며, 대부분의 예시는 10-20초 동안 지속됩니다.

키보드/마우스로 제어: 환경이 생성되면 표준 키보드 및 마우스 입력을 사용하여 이동 및 상호작용을 제어할 수 있습니다. 모델은 캐릭터와 같은 제어 가능한 요소와 나무와 같은 정적 요소를 인식합니다.

환경 탐색: 주변을 이동하고, 객체와 상호작용하며, 생성된 세계를 탐색할 수 있습니다. 모델은 일관성을 유지하며 시야에 없을 때도 영역을 기억합니다.

선택 사항: AI 에이전트 배포: 연구 목적으로, SIMA와 같은 AI 에이전트를 배포하여 자연어 지침에 따라 생성된 환경과 상호작용하고 탐색할 수 있습니다.

Google Genie 2 자주 묻는 질문

Genie 2는 Google DeepMind가 개발한 기초 세계 모델로, 단일 프롬프트 이미지를 기반으로 무한한 종류의 행동 제어 가능하고 플레이 가능한 3D 환경을 생성할 수 있습니다. 이는 키보드와 마우스 입력을 사용하는 인간과 AI 에이전트 모두가 플레이할 수 있습니다.