SAMはどのような種類の入力プロンプトをサポートしていますか？

SAMは、ポイント、ボックス、テキストプロンプト、さらにはオブジェクト検出器やAR/VRヘッドセットなどの他のシステムからの入力を含むさまざまな入力プロンプトをサポートしています。この柔軟なプロンプトシステムにより、SAMは幅広いセグメンテーションタスクに使用できます。

SAMはどのようにトレーニングされましたか？

SAMは、11百万の多様な画像に対して10億以上のセグメンテーションマスクを含む大規模データセットSA-1Bでトレーニングされました。このデータセットは、モデル・イン・ザ・ループの「データエンジン」アプローチを使用して、SAM自体を通じて反復的に作成されました。

SAMの主な機能は何ですか？

SAMは、未知のオブジェクトに対してゼロショットセグメンテーションを実行し、あいまいなプロンプトに対して複数の有効なマスクを生成し、画像内のすべてを自動的にセグメント化し、他のAIシステムと柔軟に統合することができます。その出力は、ビデオトラッキングや3Dリフティングなどのさまざまな下流タスクに使用できます。

SAM 2は元のSAMとどのように異なりますか？

SAM 2は、SAMの機能をビデオに拡張し、画像とビデオの両方でリアルタイムのプロンプト可能なオブジェクトセグメンテーションを可能にします。これは、連続ビデオ処理のためのストリーミングメモリ設計を特徴としており、元のSAMよりも高速で効率的です。

SAMは一般に利用可能ですか？

はい、SAMとSAM 2はApache 2.0ライセンスの下で利用可能です。Metaは、コンピュータビジョンのさらなる革新を促進するために、モデル、データセット、コード、研究論文を公開しました。

Segment Anything

WebsiteAI Image Segmentation AI Image Recognition

Segment Anythingは、Meta AIによって開発されたプロンプト可能なAIモデルで、ゼロショット一般化機能を持ち、任意の画像内の任意のオブジェクトをセグメントできます。

ソーシャル＆メール:

ウェブサイトを訪問

このツールを宣伝する

https://segment-anything.com/?utm_source=aipure

概要
分析
代替案

製品情報

更新日:2025年07月16日

Segment Anything の月間トラフィック傾向

Segment Anythingは7月に112.6Kのアクセスを達成し、7.1%の増加を記録しました。2025年6月には特別な更新はありませんでしたが、動画セグメンテーションに機能を拡張したSegment Anything Model 2 (SAM 2)の導入が、関心の高まりに寄与したと考えられます。

過去のトラフィックを表示

Segment Anythingとは

Segment Anything Model (SAM)は、Meta AIによって導入されたコンピュータビジョンのための画期的なAIモデルです。これは、追加のトレーニングを必要とせず、さまざまなタイプの入力プロンプトに基づいて任意の画像内の任意のオブジェクトをセグメントまたは「切り出す」ように設計されています。SAMは、11百万の多様な画像からの10億以上のマスクの大規模データセットでトレーニングされた画像セグメンテーション技術の重要な進歩を表しています。この基盤モデルは、幅広い画像セグメンテーションタスクに対して多用途で適応可能なソリューションを提供することを目指しています。

Segment Anythingの主な機能

Segment Anything (SAM)は、Meta AIによって開発された画像セグメンテーションのためのAIモデルです。ポイントやボックスなどのさまざまな入力プロンプトから高品質なオブジェクトマスクを生成し、画像内のすべてのオブジェクトをセグメント化することができます。SAMは、追加のトレーニングなしで新しいオブジェクトや画像に対してゼロショットの一般化を示します。これは、1100万枚の画像に対して10億以上のマスクの大規模データセットでトレーニングされたおかげです。このモデルの効率的な設計は、他のシステムとの柔軟な統合を可能にし、ウェブブラウザでのリアルタイム処理を実現します。

プロンプト可能なセグメンテーション: SAMは、ポイント、ボックス、またはテキストなどのさまざまな入力プロンプトからマスクを生成でき、再トレーニングなしで柔軟なセグメンテーションタスクを可能にします。

ゼロショット一般化: このモデルは、オブジェクトの一般的な理解を学習しているため、追加のトレーニングなしで未知のオブジェクトや画像をセグメント化できます。

効率的なアーキテクチャ: SAMの設計には、一度だけの画像エンコーダーと軽量のマスクデコーダーが含まれており、ウェブブラウザでも迅速な処理を可能にします。

曖昧さを考慮した出力: SAMは、曖昧なプロンプトに対して複数の有効なマスクを生成でき、包括的なセグメンテーションオプションを提供します。

Segment Anythingのユースケース

AR/VRアプリケーション: SAMは、ユーザーの視線やリアルタイムのインタラクションに基づいてオブジェクトをセグメント化するためにAR/VRシステムと統合できます。

自動画像編集: このモデルは、背景除去、オブジェクトの孤立、またはフォトエディティングソフトウェアでのコラージュなどのクリエイティブなタスクに使用できます。

医療画像分析: SAMのさまざまなオブジェクトをセグメント化する能力は、医療スキャンにおける特定の解剖学的構造の特定と孤立に適用できます。

環境モニタリング: このモデルは、衛星画像やドローン画像の要素をセグメント化して分析し、森林伐採の追跡や都市計画などのタスクに使用できます。

メリット

非常に多用途で、さまざまなセグメンテーションタスクに適応できます

ゼロショット機能により、タスク特有のトレーニングの必要性が減少します

効率的な設計により、ブラウザでのリアルタイム処理が可能です

デメリット

大きなモデルサイズは、リソースが制約されたデバイスへの展開に挑戦をもたらす可能性があります

特定のオブジェクトの識別とラベリングには、他のシステムとの統合が必要です

Segment Anythingの使い方

Segment Anythingをインストールする: GitHubリポジトリをクローンし、pipを使用してパッケージをインストールします: git clone [email protected]:facebookresearch/segment-anything.git; cd segment-anything; pip install -e .

モデルチェックポイントをダウンロードする: Segment AnythingのGitHubリポジトリから事前トレーニングされたモデルチェックポイントをダウンロードします。

必要なモジュールをインポートする: 必要なモジュールをインポートします: from segment_anything import sam_model_registry, SamAutomaticMaskGenerator, SamPredictor

モデルをロードする: チェックポイントを使用してSAMモデルをロードします: sam = sam_model_registry['<model_type>'](checkpoint='<path/to/checkpoint>')

入力画像を準備する: 入力画像をロードして前処理します: image = cv2.imread('<image_path>'); image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

マスクを生成する: SamAutomaticMaskGeneratorを使用してマスクを生成します: mask_generator = SamAutomaticMaskGenerator(sam); masks = mask_generator.generate(image)

プロンプトを提供する（オプション）: より正確なセグメンテーションのために、モデルをガイドするためにポイントやボックスのようなプロンプトを提供します: predictor = SamPredictor(sam); predictor.set_image(image); masks, _, _ = predictor.predict(<input_point>, <input_label>)

結果を視覚化する: matplotlibや他の視覚化ツールを使用して、生成されたマスクを元の画像に表示します

Segment Anythingのよくある質問

セグメント・エニシング・モデル（SAM）は、Meta AIによって開発された画像セグメンテーションのためのAIモデルです。これは、ポイントやボックスなどのさまざまな入力プロンプトに基づいて画像内の任意のオブジェクトをセグメント化することができ、追加のトレーニングを必要としません。SAMは、新しいオブジェクトや画像へのゼロショット一般化のために設計されています。