Step 3.5 Flash
Step 3.5 Flash は、スパース Mixture of Experts(MoE)アーキテクチャ上に構築されたオープンソースの基盤モデルであり、トークンごとに 196B パラメータのうち 11B のみを選択的にアクティブ化し、卓越した効率で最先端の推論およびエージェント機能を提供します。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

製品情報
更新日:2026年03月06日
Step 3.5 Flashとは
Step 3.5 Flash は、StepFun の最も有能なオープンソース基盤モデルであり、高度な推論およびツール使用機能を通じて、静的モデルをアクティブなエージェントに変換するように設計されています。256K のコンテキストウィンドウをサポートし、3 方向マルチトークン予測(MTP-3)を介して 100〜300 トークン/秒の生成スループットを実現します。このモデルは、クラウド API(OpenRouter および StepFun Platform 経由)と、Mac Studio M4 Max や NVIDIA DGX Spark などのハイエンド消費者向けハードウェアでのローカル展開の両方でアクセスできるように設計されています。
Step 3.5 Flashの主な機能
Step 3.5 Flashは、StepFunが開発した最先端のオープンソース基盤モデルで、疎な Mixture of Experts (MoE) アーキテクチャを使用し、トークンごとに196Bのパラメータのうち11Bのみを選択的にアクティブにします。256Kのコンテキストウィンドウを備え、毎秒100〜350トークンの生成速度を達成し、エージェントタスク、数学的推論、コーディング、および詳細な調査に優れており、高い効率とローカル展開のアクセシビリティを維持しています。
効率的なパラメータ使用: トークンごとに196Bのパラメータのうち11Bのみをアクティブにする疎なMoEアーキテクチャを使用し、計算効率を維持しながら高いパフォーマンスを可能にします
高度な推論能力: データの取り込み、クリーニング、特徴構築、および数学とコーディングのベンチマークで優れたパフォーマンスを発揮する結果の解釈を含む、多段階プロセスを管理する卓越した能力を示します
高速処理: 3方向マルチトークン予測(MTP-3)を搭載し、256Kのコンテキストウィンドウサポートで毎秒100〜350トークンの生成スループットを達成します
ローカル展開のサポート: Apple M4 Max、NVIDIA DGX Spark、またはAMD AI Max+ 395などのハイエンドパーソナルハードウェアでのローカル展開に最適化されており、プライベートで安全な実行を保証します
Step 3.5 Flashのユースケース
プロフェッショナルデータ分析: ビジネスインテリジェンスアプリケーション向けに、データの取り込み、クリーニング、特徴構築、結果の解釈など、エンドツーエンドのデータ分析タスクを処理します
詳細なリサーチアシスタント: 計画、検索、考察、執筆によって包括的な調査を実施し、事実の正確性を維持しながら、調査品質のベンチマークで高いスコアを達成します
コーディングと開発: コーディングベンチマークで高いパフォーマンスを発揮し、複雑なプログラミングタスクとリポジトリアーキテクチャの分析を処理できる、ソフトウェア開発を支援します
株式投資分析: 市場データ、テクニカル指標を分析し、複数のツールとの統合を通じて自動アラートを管理することにより、プロの取引推奨を生成します
メリット
選択的なパラメータアクティベーションによる高い効率
複数のベンチマークにわたる強力なパフォーマンス
強化されたプライバシーのためのローカル展開をサポート
毎秒100〜350トークンの高速推論速度
デメリット
一部の競合他社と比較して、より長い生成軌道を必要とします
分布シフト中に安定性が低下する可能性があります
高度に専門化されたドメインでのパフォーマンスが制限されています
長期的な、複数ターンの対話で矛盾を示す可能性があります
Step 3.5 Flashの使い方
アクセス方法を選択: Step 3.5 Flash には、1)OpenRouter 2)StepFun Platform API 3)GGUF 形式によるローカル展開を通じてアクセスできます
クラウド API のセットアップ(オプション 1 - OpenRouter): OpenRouter にサインアップして、API キーを取得します。ベース URL:https://openrouter.ai/api/v1 モデル:stepfun/step-3.5-flash を使用します
クラウド API のセットアップ(オプション 2 - StepFun Platform): platform.stepfun.ai(国際)または platform.stepfun.com(中国)でサインアップします。ベース URL:https://api.stepfun.ai/v1(国際)または https://api.stepfun.com/v1(中国)モデル:step-3.5-flash を使用します
エージェント機能のために OpenClaw をインストール: 実行:curl -fsSL https://openclaw.ai/install.sh | bash
OpenClaw の構成: 1)「openclaw onboard」を実行します 2)WebUI で、[構成]→[モデル]に移動します 3)タイプ:openai-completions およびベース URL:https://api.stepfun.ai/v1 でプロバイダーを追加します
ローカル展開のセットアップ: 1)Hugging Face からモデルをダウンロードします:stepfun-ai/Step-3.5-Flash-FP8 または INT4 バージョン 2)推論に vLLM または llama.cpp を使用します 3)NVIDIA DGX Spark または Apple M4 Max などのハイエンドハードウェアが必要です
Web インターフェースへのアクセス: Web インターフェースを使用するには、stepfun.ai(国際)または stepfun.com(中国)にアクセスします
モバイルアプリへのアクセス: iOS App Store または Google Play Store から StepFun アプリをダウンロードします
コミュニティに参加: 更新とサポートについては、https://discord.gg/RcMJhNVAQc で Discord コミュニティに参加してください
Step 3.5 Flashのよくある質問
Step 3.5 Flashは、最先端の推論およびエージェント機能のために設計されたオープンソースの基盤モデルです。スパースなMixture of Experts(MoE)アーキテクチャを使用しており、トークンごとに196Bパラメータのうち11Bのみをアクティブにします。100〜300トークン/秒の生成速度で、深い推論、コーディング、およびエージェントタスクに優れています。











