SAM支持哪些类型的输入提示？

SAM支持多种输入提示，包括点、框、文本提示，甚至来自其他系统（如对象检测器或AR/VR头盔）的输入。这种灵活的提示系统使SAM能够用于广泛的分割任务。

SAM是如何训练的？

SAM在一个名为SA-1B的庞大数据集上进行了训练，该数据集包含超过1100万张多样图像上的10亿个分割掩码。该数据集是通过使用SAM本身在模型循环中的“数据引擎”方法进行迭代过程创建的。

SAM有哪些关键能力？

SAM可以在不熟悉的对象上进行零样本分割，为模糊提示生成多个有效掩码，自动分割图像中的所有内容，并灵活地与其他AI系统集成。其输出可用于视频跟踪和3D提升等各种下游任务。

SAM 2与原始SAM有何不同？

SAM 2将SAM的能力扩展到视频，允许在图像和视频中进行实时、可提示的对象分割。它具有用于顺序视频处理的流式内存设计，并且比原始SAM更快、更高效。

SAM是否可供公众使用？

是的，SAM和SAM 2在Apache 2.0许可下可用。Meta已经发布了模型、数据集、代码和研究论文，以促进计算机视觉领域的进一步创新。

Segment Anything

WebsiteAI Image Segmentation AI Image Recognition

Segment Anything是由Meta AI开发的具有零样本泛化能力的可提示AI模型，能够分割任何图像中的任何对象。

社交和电子邮件：

访问网站

推广此工具

https://segment-anything.com/?utm_source=aipure

概述
分析
替代方案

产品信息

更新于：2025年07月16日

Segment Anything 月度流量趋势

Segment Anything 在7月份获得了112.6K 访问量，增长了7.1%。虽然在2025年6月没有特定的更新，但Segment Anything Model 2 (SAM 2)的推出扩展了视频分割的功能，这可能促进了人们对它的兴趣增长。

查看历史流量

什么是 Segment Anything

Segment Anything Model（SAM）是由Meta AI引入的计算机视觉领域的突破性AI模型。它旨在根据各种类型的输入提示对任何图像中的任何对象进行分割或“剪切”，而无需额外的训练。SAM代表了图像分割技术的重大进步，它在一个包含超过10亿个掩码的1100万张多样化图像的庞大数据集上进行了训练。这一基础模型旨在为广泛的图像分割任务提供多功能和适应性强的解决方案。

Segment Anything 的主要功能

Segment Anything（SAM）是由Meta AI开发的一种用于图像分割的AI模型。它能够根据点或框等各种输入提示生成高质量的对象掩码，并分割图像中的所有对象。得益于在超过11亿个掩码的1100万张图像上的训练，SAM展示了零样本泛化到新对象和图像的能力，无需额外训练。该模型的有效设计使其能够灵活地与其他系统集成，并支持在网络浏览器中实时处理。

可提示分割: SAM可以根据点、框或文本等各种输入提示生成掩码，无需重新训练即可进行灵活的分割任务。

零样本泛化: 该模型无需额外训练即可分割不熟悉的对象和图像，因为它已经学习了对对象的通用理解。

高效架构: SAM的设计包括一次性图像编码器和轻量级掩码解码器，即使在网络浏览器中也能实现快速处理。

模糊感知输出: SAM可以为模糊提示生成多个有效掩码，提供全面的分割选项。

Segment Anything 的使用场景

AR/VR应用: SAM可以与AR/VR系统集成，根据用户的注视或实时交互来分割对象。

自动化图像编辑: 该模型可用于照片编辑软件中的背景移除、对象隔离或创意任务，如拼贴。

医学影像分析: SAM分割各种对象的能力可应用于医学扫描中识别和隔离特定的解剖结构。

环境监测: 该模型可用于卫星或无人机图像中元素的分割和分析，用于如森林砍伐追踪或城市规划等任务。

优点

高度通用且适应性强，适用于各种分割任务

零样本能力减少了特定任务训练的需求

高效设计允许在浏览器中进行实时处理

缺点

模型尺寸较大，可能对资源受限设备的部署构成挑战

需要与其他系统集成以进行特定对象的识别和标记

如何使用 Segment Anything

安装Segment Anything: 克隆GitHub仓库并通过pip安装包：git clone [email protected]:facebookresearch/segment-anything.git; cd segment-anything; pip install -e .

下载模型检查点: 从Segment Anything GitHub仓库下载预训练模型检查点。

导入所需模块: 导入必要的模块：from segment_anything import sam_model_registry, SamAutomaticMaskGenerator, SamPredictor

加载模型: 使用检查点加载SAM模型：sam = sam_model_registry['<model_type>'](checkpoint='<path/to/checkpoint>')

准备输入图像: 加载并预处理输入图像：image = cv2.imread('<image_path>'); image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

生成掩码: 使用SamAutomaticMaskGenerator生成掩码：mask_generator = SamAutomaticMaskGenerator(sam); masks = mask_generator.generate(image)

提供提示（可选）: 为了更精确的分割，提供点或框等提示以指导模型：predictor = SamPredictor(sam); predictor.set_image(image); masks, _, _ = predictor.predict(<input_point>, <input_label>)

可视化结果: 使用matplotlib或其他可视化工具在原始图像上显示生成的掩码