Step 3.5 Flash

Step 3.5 Flash は、スパース Mixture of Experts(MoE)アーキテクチャ上に構築されたオープンソースの基盤モデルであり、トークンごとに 196B パラメータのうち 11B のみを選択的にアクティブ化し、卓越した効率で最先端の推論およびエージェント機能を提供します。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure
Step 3.5 Flash

製品情報

更新日:2026年03月06日

Step 3.5 Flashとは

Step 3.5 Flash は、StepFun の最も有能なオープンソース基盤モデルであり、高度な推論およびツール使用機能を通じて、静的モデルをアクティブなエージェントに変換するように設計されています。256K のコンテキストウィンドウをサポートし、3 方向マルチトークン予測(MTP-3)を介して 100〜300 トークン/秒の生成スループットを実現します。このモデルは、クラウド API(OpenRouter および StepFun Platform 経由)と、Mac Studio M4 Max や NVIDIA DGX Spark などのハイエンド消費者向けハードウェアでのローカル展開の両方でアクセスできるように設計されています。

Step 3.5 Flashの主な機能

Step 3.5 Flashは、StepFunが開発した最先端のオープンソース基盤モデルで、疎な Mixture of Experts (MoE) アーキテクチャを使用し、トークンごとに196Bのパラメータのうち11Bのみを選択的にアクティブにします。256Kのコンテキストウィンドウを備え、毎秒100〜350トークンの生成速度を達成し、エージェントタスク、数学的推論、コーディング、および詳細な調査に優れており、高い効率とローカル展開のアクセシビリティを維持しています。
効率的なパラメータ使用: トークンごとに196Bのパラメータのうち11Bのみをアクティブにする疎なMoEアーキテクチャを使用し、計算効率を維持しながら高いパフォーマンスを可能にします
高度な推論能力: データの取り込み、クリーニング、特徴構築、および数学とコーディングのベンチマークで優れたパフォーマンスを発揮する結果の解釈を含む、多段階プロセスを管理する卓越した能力を示します
高速処理: 3方向マルチトークン予測(MTP-3)を搭載し、256Kのコンテキストウィンドウサポートで毎秒100〜350トークンの生成スループットを達成します
ローカル展開のサポート: Apple M4 Max、NVIDIA DGX Spark、またはAMD AI Max+ 395などのハイエンドパーソナルハードウェアでのローカル展開に最適化されており、プライベートで安全な実行を保証します

Step 3.5 Flashのユースケース

プロフェッショナルデータ分析: ビジネスインテリジェンスアプリケーション向けに、データの取り込み、クリーニング、特徴構築、結果の解釈など、エンドツーエンドのデータ分析タスクを処理します
詳細なリサーチアシスタント: 計画、検索、考察、執筆によって包括的な調査を実施し、事実の正確性を維持しながら、調査品質のベンチマークで高いスコアを達成します
コーディングと開発: コーディングベンチマークで高いパフォーマンスを発揮し、複雑なプログラミングタスクとリポジトリアーキテクチャの分析を処理できる、ソフトウェア開発を支援します
株式投資分析: 市場データ、テクニカル指標を分析し、複数のツールとの統合を通じて自動アラートを管理することにより、プロの取引推奨を生成します

メリット

選択的なパラメータアクティベーションによる高い効率
複数のベンチマークにわたる強力なパフォーマンス
強化されたプライバシーのためのローカル展開をサポート
毎秒100〜350トークンの高速推論速度

デメリット

一部の競合他社と比較して、より長い生成軌道を必要とします
分布シフト中に安定性が低下する可能性があります
高度に専門化されたドメインでのパフォーマンスが制限されています
長期的な、複数ターンの対話で矛盾を示す可能性があります

Step 3.5 Flashの使い方

アクセス方法を選択: Step 3.5 Flash には、1)OpenRouter 2)StepFun Platform API 3)GGUF 形式によるローカル展開を通じてアクセスできます
クラウド API のセットアップ(オプション 1 - OpenRouter): OpenRouter にサインアップして、API キーを取得します。ベース URL:https://openrouter.ai/api/v1 モデル:stepfun/step-3.5-flash を使用します
クラウド API のセットアップ(オプション 2 - StepFun Platform): platform.stepfun.ai(国際)または platform.stepfun.com(中国)でサインアップします。ベース URL:https://api.stepfun.ai/v1(国際)または https://api.stepfun.com/v1(中国)モデル:step-3.5-flash を使用します
エージェント機能のために OpenClaw をインストール: 実行:curl -fsSL https://openclaw.ai/install.sh | bash
OpenClaw の構成: 1)「openclaw onboard」を実行します 2)WebUI で、[構成]→[モデル]に移動します 3)タイプ:openai-completions およびベース URL:https://api.stepfun.ai/v1 でプロバイダーを追加します
ローカル展開のセットアップ: 1)Hugging Face からモデルをダウンロードします:stepfun-ai/Step-3.5-Flash-FP8 または INT4 バージョン 2)推論に vLLM または llama.cpp を使用します 3)NVIDIA DGX Spark または Apple M4 Max などのハイエンドハードウェアが必要です
Web インターフェースへのアクセス: Web インターフェースを使用するには、stepfun.ai(国際)または stepfun.com(中国)にアクセスします
モバイルアプリへのアクセス: iOS App Store または Google Play Store から StepFun アプリをダウンロードします
コミュニティに参加: 更新とサポートについては、https://discord.gg/RcMJhNVAQc で Discord コミュニティに参加してください

Step 3.5 Flashのよくある質問

Step 3.5 Flashは、最先端の推論およびエージェント機能のために設計されたオープンソースの基盤モデルです。スパースなMixture of Experts(MoE)アーキテクチャを使用しており、トークンごとに196Bパラメータのうち11Bのみをアクティブにします。100〜300トークン/秒の生成速度で、深い推論、コーディング、およびエージェントタスクに優れています。

Step 3.5 Flashに類似した最新のAIツール

Athena AI
Athena AI
Athena AIは、ドキュメント分析、クイズ生成、フラッシュカード、インタラクティブチャット機能などを通じて、個別化された学習支援、ビジネスソリューション、ライフコーチングを提供する多用途のAI駆動プラットフォームです
Aguru AI
Aguru AI
Aguru AIは、行動追跡、異常検出、パフォーマンス最適化などの機能を備えたLLMベースのアプリケーションの包括的な監視、セキュリティ、および最適化ツールを提供するオンプレミスソフトウェアソリューションです。
GOAT AI
GOAT AI
GOAT AIは、ニュース記事、研究論文、動画などのさまざまなコンテンツタイプに対してワンクリック要約機能を提供するAI駆動のプラットフォームであり、ドメイン特有のタスクのための高度なAIエージェントオーケストレーションも提供しています。
GiGOS
GiGOS
GiGOSは、Gemini、GPT-4、Claude、Grokなどの複数の高度な言語モデルにアクセスできるAIプラットフォームで、ユーザーが異なるAIモデルと対話し、比較するための直感的なインターフェースを提供します