Meta Segment Anything Model 2 Giới thiệu
WebsiteAI Image Segmentation
Mô hình Phân đoạn Bất kỳ của Meta 2 (SAM 2) là một mô hình AI mạnh mẽ cho phép phân đoạn đối tượng theo thời gian thực, có thể gợi ý trên cả hình ảnh và video với khả năng tổng quát không cần huấn luyện.
Xem thêmMeta Segment Anything Model 2 là gì
Mô hình Phân đoạn Bất kỳ của Meta 2 (SAM 2) là thế hệ tiếp theo của Mô hình Phân đoạn Bất kỳ của Meta, mở rộng khả năng phân đoạn đối tượng từ hình ảnh đến video. Được phát hành bởi Meta AI, SAM 2 là một mô hình thống nhất có thể xác định và theo dõi các đối tượng qua các khung video trong thời gian thực, trong khi vẫn duy trì tất cả các khả năng phân đoạn hình ảnh của người tiền nhiệm. Nó sử dụng một kiến trúc duy nhất để xử lý cả nhiệm vụ hình ảnh và video, sử dụng học không cần huấn luyện để phân đoạn các đối tượng mà nó chưa được đào tạo cụ thể. SAM 2 đại diện cho một bước tiến quan trọng trong công nghệ thị giác máy tính, cung cấp độ chính xác, tốc độ và tính linh hoạt được cải thiện so với các mô hình trước đó.
Meta Segment Anything Model 2 hoạt động như thế nào?
SAM 2 sử dụng kiến trúc dựa trên transformer, kết hợp một bộ mã hóa hình ảnh Vision Transformer (ViT), một bộ mã hóa gợi ý cho các tương tác của người dùng, và một bộ giải mã mặt nạ để tạo ra kết quả phân đoạn. Mô hình giới thiệu một mô-đun bộ nhớ theo phiên ghi lại thông tin về các đối tượng mục tiêu trong video, cho phép nó theo dõi các đối tượng qua các khung hình ngay cả khi chúng tạm thời biến mất khỏi tầm nhìn. Người dùng có thể tương tác với SAM 2 thông qua nhiều gợi ý đầu vào như nhấp chuột, hộp hoặc mặt nạ trên bất kỳ khung hình hình ảnh hoặc video nào. Mô hình sau đó xử lý các đầu vào này để phân đoạn và theo dõi các đối tượng trong thời gian thực. Đối với xử lý video, SAM 2 sử dụng một kiến trúc phát trực tuyến, phân tích các khung hình theo thứ tự để duy trì hiệu quả và cho phép các ứng dụng thời gian thực. Khi được áp dụng cho hình ảnh tĩnh, mô-đun bộ nhớ vẫn trống, và mô hình hoạt động tương tự như SAM gốc.
Lợi ích của Meta Segment Anything Model 2
SAM 2 cung cấp nhiều lợi ích trong nhiều ngành công nghiệp và ứng dụng khác nhau. Cách tiếp cận thống nhất của nó đối với phân đoạn hình ảnh và video giúp đơn giản hóa quy trình làm việc và giảm nhu cầu về các mô hình riêng biệt. Khả năng tổng quát không cần huấn luyện cho phép nó xử lý một loạt các đối tượng mà không cần đào tạo thêm, làm cho nó rất linh hoạt. Xử lý thời gian thực và tính tương tác cho phép các ứng dụng động trong các lĩnh vực như chỉnh sửa video, thực tế tăng cường và xe tự hành. Độ chính xác và hiệu quả được cải thiện của SAM 2, yêu cầu thời gian tương tác ít hơn ba lần so với các mô hình hiện có, có thể nâng cao đáng kể năng suất trong các nhiệm vụ liên quan đến phân đoạn và theo dõi đối tượng. Thêm vào đó, tính chất mã nguồn mở và tập dữ liệu toàn diện của nó khuyến khích nghiên cứu và phát triển thêm trong lĩnh vực thị giác máy tính, có khả năng dẫn đến những đổi mới và ứng dụng mới trong nhiều lĩnh vực.
Xu hướng Lưu lượng Truy cập Hàng tháng của Meta Segment Anything Model 2
Meta Segment Anything Model 2 đã trải qua sự sụt giảm 13,7% về lưu lượng truy cập, đạt 1,2 triệu lượt truy cập. Mặc dù việc phát hành gần đây các mô hình Llama 4 và tăng cường đầu tư vào cơ sở hạ tầng AI không ảnh hưởng trực tiếp đến sản phẩm này, nhưng việc người đứng đầu bộ phận nghiên cứu AI của Meta từ chức và việc tái cơ cấu nội bộ có thể đã góp phần vào sự sụt giảm này.
Xem lịch sử lưu lượng truy cập
Bài viết phổ biến

VideoIdeas.ai: Hướng dẫn tối thượng để tạo video YouTube lan truyền theo phong cách độc đáo của bạn (2025)
Apr 11, 2025

Đánh giá đầy đủ về GPT-4o: Trình tạo ảnh AI tốt nhất cho mọi người năm 2025
Apr 8, 2025

Reve 1.0: Trình tạo ảnh AI mang tính cách mạng và cách sử dụng
Mar 31, 2025

Gemma 3 của Google: Khám phá Mô hình AI Hiệu quả Nhất Hiện nay | Hướng dẫn Cài đặt và Sử dụng 2025
Mar 18, 2025
Xem thêm