Meta Segment Anything Model 2 Giới thiệu
WebsiteAI Image Segmentation
Mô hình Phân đoạn Bất kỳ của Meta 2 (SAM 2) là một mô hình AI mạnh mẽ cho phép phân đoạn đối tượng theo thời gian thực, có thể gợi ý trên cả hình ảnh và video với khả năng tổng quát không cần huấn luyện.
Xem thêmMeta Segment Anything Model 2 là gì
Mô hình Phân đoạn Bất kỳ của Meta 2 (SAM 2) là thế hệ tiếp theo của Mô hình Phân đoạn Bất kỳ của Meta, mở rộng khả năng phân đoạn đối tượng từ hình ảnh đến video. Được phát hành bởi Meta AI, SAM 2 là một mô hình thống nhất có thể xác định và theo dõi các đối tượng qua các khung video trong thời gian thực, trong khi vẫn duy trì tất cả các khả năng phân đoạn hình ảnh của người tiền nhiệm. Nó sử dụng một kiến trúc duy nhất để xử lý cả nhiệm vụ hình ảnh và video, sử dụng học không cần huấn luyện để phân đoạn các đối tượng mà nó chưa được đào tạo cụ thể. SAM 2 đại diện cho một bước tiến quan trọng trong công nghệ thị giác máy tính, cung cấp độ chính xác, tốc độ và tính linh hoạt được cải thiện so với các mô hình trước đó.
Meta Segment Anything Model 2 hoạt động như thế nào?
SAM 2 sử dụng kiến trúc dựa trên transformer, kết hợp một bộ mã hóa hình ảnh Vision Transformer (ViT), một bộ mã hóa gợi ý cho các tương tác của người dùng, và một bộ giải mã mặt nạ để tạo ra kết quả phân đoạn. Mô hình giới thiệu một mô-đun bộ nhớ theo phiên ghi lại thông tin về các đối tượng mục tiêu trong video, cho phép nó theo dõi các đối tượng qua các khung hình ngay cả khi chúng tạm thời biến mất khỏi tầm nhìn. Người dùng có thể tương tác với SAM 2 thông qua nhiều gợi ý đầu vào như nhấp chuột, hộp hoặc mặt nạ trên bất kỳ khung hình hình ảnh hoặc video nào. Mô hình sau đó xử lý các đầu vào này để phân đoạn và theo dõi các đối tượng trong thời gian thực. Đối với xử lý video, SAM 2 sử dụng một kiến trúc phát trực tuyến, phân tích các khung hình theo thứ tự để duy trì hiệu quả và cho phép các ứng dụng thời gian thực. Khi được áp dụng cho hình ảnh tĩnh, mô-đun bộ nhớ vẫn trống, và mô hình hoạt động tương tự như SAM gốc.
Lợi ích của Meta Segment Anything Model 2
SAM 2 cung cấp nhiều lợi ích trong nhiều ngành công nghiệp và ứng dụng khác nhau. Cách tiếp cận thống nhất của nó đối với phân đoạn hình ảnh và video giúp đơn giản hóa quy trình làm việc và giảm nhu cầu về các mô hình riêng biệt. Khả năng tổng quát không cần huấn luyện cho phép nó xử lý một loạt các đối tượng mà không cần đào tạo thêm, làm cho nó rất linh hoạt. Xử lý thời gian thực và tính tương tác cho phép các ứng dụng động trong các lĩnh vực như chỉnh sửa video, thực tế tăng cường và xe tự hành. Độ chính xác và hiệu quả được cải thiện của SAM 2, yêu cầu thời gian tương tác ít hơn ba lần so với các mô hình hiện có, có thể nâng cao đáng kể năng suất trong các nhiệm vụ liên quan đến phân đoạn và theo dõi đối tượng. Thêm vào đó, tính chất mã nguồn mở và tập dữ liệu toàn diện của nó khuyến khích nghiên cứu và phát triển thêm trong lĩnh vực thị giác máy tính, có khả năng dẫn đến những đổi mới và ứng dụng mới trong nhiều lĩnh vực.
Bài viết phổ biến
Black Forest Labs Ra Mắt FLUX.1 Tools: Bộ Công Cụ Tạo Ảnh AI Tốt Nhất
Nov 22, 2024
Microsoft Ignite 2024: Giới thiệu Azure AI Foundry Mở khóa Cuộc cách mạng AI
Nov 21, 2024
OpenAI Ra Mắt ChatGPT Advanced Voice Mode Trên Nền Tảng Web
Nov 20, 2024
Nền tảng đa trí tuệ nhân tạo AnyChat tích hợp ChatGPT, Gemini, Claude và nhiều hơn nữa
Nov 19, 2024
Xem thêm