Google Genie 2 Giới thiệu
Genie 2 là mô hình thế giới cơ sở của Google DeepMind có thể tạo ra vô số loại môi trường 3D có thể điều khiển hành động, có thể chơi được từ một hình ảnh gợi ý duy nhất cho việc đào tạo và đánh giá các tác nhân AI.
Xem thêmGoogle Genie 2 là gì
Genie 2 là một mô hình AI đột phá được phát triển bởi Google DeepMind, đại diện cho một bước tiến quan trọng trong việc tạo ra các môi trường 3D ảo tương tác. Là người kế nhiệm của Genie 1, tập trung vào các thế giới 2D, Genie 2 có thể tạo ra các môi trường 3D phong phú, đa dạng và có thể chơi được dựa trên một hình ảnh gợi ý duy nhất. Mô hình cho phép cả con người và các tác nhân AI tương tác với các môi trường được tạo ra này bằng cách sử dụng đầu vào bàn phím và chuột tiêu chuẩn, duy trì tính nhất quán trong tối đa 60 giây chơi game trong khi thể hiện các khả năng tinh vi trong vật lý, tương tác đối tượng, hoạt hình nhân vật và mô phỏng hành vi NPC.
Google Genie 2 hoạt động như thế nào?
Genie 2 hoạt động như một mô hình khuếch tán tiềm ẩn tự hồi tiếp được đào tạo trên một tập dữ liệu video lớn. Quá trình bắt đầu với một hình ảnh gợi ý (có thể được tạo ra bởi Imagen 3 hoặc là một bức ảnh thật) xác định môi trường mong muốn. Hệ thống đầu tiên truyền đầu vào qua một autoencoder, sau đó xử lý các khung tiềm ẩn bằng cách sử dụng một mô hình biến thể lớn với mặt nạ nguyên nhân tương tự như các mô hình ngôn ngữ. Trong quá trình suy diễn, Genie 2 tạo ra môi trường khung theo khung theo cách tự hồi tiếp, xem xét các khung trước đó và hành động của người dùng trong khi sử dụng hướng dẫn không phân loại để cải thiện khả năng điều khiển hành động. Mô hình thể hiện các khả năng đáng chú ý bao gồm trí nhớ dài hạn (nhớ các yếu tố ngoài màn hình), mô phỏng vật lý, hiệu ứng ánh sáng và hoạt hình nhân vật phức tạp.
Lợi ích của Google Genie 2
Lợi ích chính của Genie 2 nằm ở khả năng tăng tốc nghiên cứu AI bằng cách cung cấp môi trường đào tạo đa dạng không giới hạn cho các tác nhân thể hiện. Nó cho phép tạo mẫu nhanh chóng các trải nghiệm tương tác mà không cần tài nguyên phát triển trò chơi truyền thống, cho phép các nhà nghiên cứu và nhà thiết kế nhanh chóng thử nghiệm với các môi trường mới lạ. Khả năng của hệ thống làm việc với nhiều loại đầu vào - từ nghệ thuật khái niệm đến ảnh thật - khiến nó trở thành một công cụ quý giá cho các quy trình sáng tạo. Thêm vào đó, khả năng tạo ra các môi trường 3D nhất quán, nhận thức vật lý mở ra những khả năng mới cho việc kiểm tra và đánh giá các tác nhân AI trong các kịch bản đa dạng, có khả năng tăng tốc tiến trình hướng tới các hệ thống AI tổng quát hơn.
Xu hướng Lưu lượng Truy cập Hàng tháng của Google Genie 2
Google Genie 2 đã đạt được 4,6 triệu lượt truy cập với mức tăng trưởng 233,7% trong tháng 12. Phiên bản Gemini 2.0 đã giới thiệu các khả năng đa phương thức mở rộng, bao gồm tạo hình ảnh và âm thanh, điều này đã cải thiện đáng kể sự tương tác của người dùng. Ngoài ra, Genie 2 có thể tạo ra nhiều thế giới 3D có thể chơi được, từ đó thúc đẩy thêm sự quan tâm và lưu lượng truy cập.
Xem lịch sử lưu lượng truy cập
Xem thêm