Step 3.5 Flashにはいくつのパラメータがあり、どのように管理していますか？

Step 3.5 Flashは、合計196Bのパラメータを持っていますが、推論中にトークンごとに11Bのパラメータのみを選択的にアクティブにするスパースなMixture-of-Experts（MoE）アーキテクチャを使用しているため、非常に効率的です。

Step 3.5 Flashのコンテキストウィンドウサイズはどれくらいですか？

Step 3.5 Flashは、3：1のスライディングウィンドウアテンション（SWA）比率のハイブリッドアプローチを使用して、256Kのコンテキストウィンドウをサポートしています。これは、1つのフルアテンションレイヤーごとに3つのSWAレイヤーを統合します。

開発者はどのようにStep 3.5 Flashにアクセスできますか？

開発者は、OpenRouter、StepFun Platform（api.stepfun.ai）、OpenClawプラットフォーム、またはMac Studio M4 MaxやNVIDIA DGX Sparkなどのハイエンドコンシューマーハードウェアでのローカルデプロイメントを通じて、Step 3.5 Flashにアクセスできます。

Step 3.5 Flashの既知の制限事項は何ですか？

主な制限事項は次のとおりです。1）同等の品質に達するために、一部の競合他社よりも長い生成軌道を必要とする、2）特殊なドメインでの分布シフト中に安定性が低下する可能性がある、3）長期的な、複数ターンの対話で反復的な推論と矛盾を示す可能性がある。

Step 3.5 Flash

WebsiteAppFree TrialLarge Language Models (LLMs)AI Tools Directory

Step 3.5 Flash は、スパース Mixture of Experts（MoE）アーキテクチャ上に構築されたオープンソースの基盤モデルであり、トークンごとに 196B パラメータのうち 11B のみを選択的にアクティブ化し、卓越した効率で最先端の推論およびエージェント機能を提供します。

ウェブサイトを訪問

このツールを宣伝する

https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

概要
代替案

製品情報

更新日:2026年05月30日

Step 3.5 Flashとは

Step 3.5 Flash は、StepFun の最も有能なオープンソース基盤モデルであり、高度な推論およびツール使用機能を通じて、静的モデルをアクティブなエージェントに変換するように設計されています。256K のコンテキストウィンドウをサポートし、3 方向マルチトークン予測（MTP-3）を介して 100〜300 トークン/秒の生成スループットを実現します。このモデルは、クラウド API（OpenRouter および StepFun Platform 経由）と、Mac Studio M4 Max や NVIDIA DGX Spark などのハイエンド消費者向けハードウェアでのローカル展開の両方でアクセスできるように設計されています。

Step 3.5 Flashの主な機能

Step 3.5 Flashは、StepFunが開発した最先端のオープンソース基盤モデルで、疎な Mixture of Experts (MoE) アーキテクチャを使用し、トークンごとに196Bのパラメータのうち11Bのみを選択的にアクティブにします。256Kのコンテキストウィンドウを備え、毎秒100〜350トークンの生成速度を達成し、エージェントタスク、数学的推論、コーディング、および詳細な調査に優れており、高い効率とローカル展開のアクセシビリティを維持しています。

効率的なパラメータ使用: トークンごとに196Bのパラメータのうち11Bのみをアクティブにする疎なMoEアーキテクチャを使用し、計算効率を維持しながら高いパフォーマンスを可能にします

高度な推論能力: データの取り込み、クリーニング、特徴構築、および数学とコーディングのベンチマークで優れたパフォーマンスを発揮する結果の解釈を含む、多段階プロセスを管理する卓越した能力を示します

高速処理: 3方向マルチトークン予測（MTP-3）を搭載し、256Kのコンテキストウィンドウサポートで毎秒100〜350トークンの生成スループットを達成します

ローカル展開のサポート: Apple M4 Max、NVIDIA DGX Spark、またはAMD AI Max+ 395などのハイエンドパーソナルハードウェアでのローカル展開に最適化されており、プライベートで安全な実行を保証します

Step 3.5 Flashのユースケース

プロフェッショナルデータ分析: ビジネスインテリジェンスアプリケーション向けに、データの取り込み、クリーニング、特徴構築、結果の解釈など、エンドツーエンドのデータ分析タスクを処理します

詳細なリサーチアシスタント: 計画、検索、考察、執筆によって包括的な調査を実施し、事実の正確性を維持しながら、調査品質のベンチマークで高いスコアを達成します

コーディングと開発: コーディングベンチマークで高いパフォーマンスを発揮し、複雑なプログラミングタスクとリポジトリアーキテクチャの分析を処理できる、ソフトウェア開発を支援します

株式投資分析: 市場データ、テクニカル指標を分析し、複数のツールとの統合を通じて自動アラートを管理することにより、プロの取引推奨を生成します

メリット

選択的なパラメータアクティベーションによる高い効率

複数のベンチマークにわたる強力なパフォーマンス

強化されたプライバシーのためのローカル展開をサポート

毎秒100〜350トークンの高速推論速度

デメリット

一部の競合他社と比較して、より長い生成軌道を必要とします

分布シフト中に安定性が低下する可能性があります

高度に専門化されたドメインでのパフォーマンスが制限されています

長期的な、複数ターンの対話で矛盾を示す可能性があります

Step 3.5 Flashの使い方

アクセス方法を選択: Step 3.5 Flash には、1）OpenRouter 2）StepFun Platform API 3）GGUF 形式によるローカル展開を通じてアクセスできます

クラウド API のセットアップ（オプション 1 - OpenRouter）: OpenRouter にサインアップして、API キーを取得します。ベース URL：https://openrouter.ai/api/v1 モデル：stepfun/step-3.5-flash を使用します

クラウド API のセットアップ（オプション 2 - StepFun Platform）: platform.stepfun.ai（国際）または platform.stepfun.com（中国）でサインアップします。ベース URL：https://api.stepfun.ai/v1（国際）または https://api.stepfun.com/v1（中国）モデル：step-3.5-flash を使用します

エージェント機能のために OpenClaw をインストール: 実行：curl -fsSL https://openclaw.ai/install.sh | bash

OpenClaw の構成: 1）「openclaw onboard」を実行します 2）WebUI で、[構成]→[モデル]に移動します 3）タイプ：openai-completions およびベース URL：https://api.stepfun.ai/v1 でプロバイダーを追加します

ローカル展開のセットアップ: 1）Hugging Face からモデルをダウンロードします：stepfun-ai/Step-3.5-Flash-FP8 または INT4 バージョン 2）推論に vLLM または llama.cpp を使用します 3）NVIDIA DGX Spark または Apple M4 Max などのハイエンドハードウェアが必要です

Web インターフェースへのアクセス: Web インターフェースを使用するには、stepfun.ai（国際）または stepfun.com（中国）にアクセスします

モバイルアプリへのアクセス: iOS App Store または Google Play Store から StepFun アプリをダウンロードします

コミュニティに参加: 更新とサポートについては、https://discord.gg/RcMJhNVAQc で Discord コミュニティに参加してください

Step 3.5 Flashのよくある質問

Step 3.5 Flashは、最先端の推論およびエージェント機能のために設計されたオープンソースの基盤モデルです。スパースなMixture of Experts（MoE）アーキテクチャを使用しており、トークンごとに196Bパラメータのうち11Bのみをアクティブにします。100〜300トークン/秒の生成速度で、深い推論、コーディング、およびエージェントタスクに優れています。