Step 3.5 Flash
Step 3.5 Flash 是一個開源基礎模型,建立在稀疏的專家混合 (MoE) 架構之上,該架構有選擇地僅激活每個令牌 196B 參數中的 11B,從而以卓越的效率提供前沿的推理和代理能力。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

產品資訊
更新時間:2026年03月06日
什麼是 Step 3.5 Flash
Step 3.5 Flash 是 StepFun 最強大的開源基礎模型,旨在透過先進的推理和工具使用能力將靜態模型轉變為活動代理。它支援 256K 上下文視窗,並透過三向多令牌預測 (MTP-3) 實現 100-300 個令牌/秒的生成吞吐量。該模型旨在透過雲端 API(透過 OpenRouter 和 StepFun 平台)以及在 Mac Studio M4 Max 和 NVIDIA DGX Spark 等高端消費者硬體上進行本地部署來存取。
Step 3.5 Flash 的主要功能
Step 3.5 Flash是由StepFun開發的尖端開源基礎模型,採用稀疏的混合專家(MoE)架構,每個token僅選擇性地激活其1960億參數中的110億個。它具有256K的上下文窗口,實現每秒100-350個token的生成速度,並且擅長代理任務、數學推理、編碼和深度研究,同時保持高效率和本地部署的可訪問性。
高效的參數使用: 使用稀疏的MoE架構,每個token僅激活1960億參數中的110億個,從而在保持計算效率的同時實現高性能
高級推理能力: 在管理多階段流程(包括數據攝取、清理、特徵構建和結果解釋)方面表現出卓越的能力,在數學和編碼基準上表現出色
高速處理: 在256K上下文窗口的支持下,實現每秒100-350個token的生成吞吐量,由三向多token預測(MTP-3)提供支持
本地部署支持: 針對在高端個人硬件(如Apple M4 Max、NVIDIA DGX Spark或AMD AI Max+ 395)上進行本地部署進行了優化,從而確保私密和安全的執行
Step 3.5 Flash 的使用案例
專業數據分析: 處理端到端的數據分析任務,包括數據攝取、清理、特徵構建和結果解釋,適用於商業智能應用
深度研究助理: 通過規劃、搜索、反思和寫作進行全面的研究,在研究質量基準上取得高分,同時保持事實準確性
編碼和開發: 協助軟件開發,在編碼基準上表現出色,能夠處理複雜的編程任務和存儲庫架構分析
股票投資分析: 通過分析市場數據、技術指標以及通過與多種工具集成來管理自動警報,從而生成專業的交易建議
優點
通過選擇性參數激活實現高效率
在多個基準上表現出色
支持本地部署以增強隱私
快速的推理速度,每秒100-350個token
缺點
與某些競爭對手相比,需要更長的生成軌跡
在分佈轉移期間可能會降低穩定性
在高度專業化的領域中性能有限
在長期的多輪對話中可能會出現不一致
如何使用 Step 3.5 Flash
選擇存取方法: 您可以透過以下方式存取 Step 3.5 Flash:1) OpenRouter 2) StepFun 平台 API 3) 透過 GGUF 格式進行本地部署
雲端 API 設定(選項 1 - OpenRouter): 在 OpenRouter 註冊以取得您的 API 金鑰。使用基本 URL:https://openrouter.ai/api/v1,模型:stepfun/step-3.5-flash
雲端 API 設定(選項 2 - StepFun 平台): 在 platform.stepfun.ai(國際)或 platform.stepfun.com(中國)註冊。使用基本 URL:https://api.stepfun.ai/v1(國際)或 https://api.stepfun.com/v1(中國),模型:step-3.5-flash
安裝 OpenClaw 以獲得代理功能: 執行:curl -fsSL https://openclaw.ai/install.sh | bash
設定 OpenClaw: 1) 執行 'openclaw onboard' 2) 在 WebUI 中,前往 Config → Models 3) 新增提供者,類型:openai-completions,基本 URL:https://api.stepfun.ai/v1
本地部署設定: 1) 從 Hugging Face 下載模型:stepfun-ai/Step-3.5-Flash-FP8 或 INT4 版本 2) 使用 vLLM 或 llama.cpp 進行推論 3) 需要 NVIDIA DGX Spark 或 Apple M4 Max 等高端硬體
網頁介面存取: 造訪 stepfun.ai(國際)或 stepfun.com(中國)以使用網頁介面
行動應用程式存取: 從 iOS App Store 或 Google Play Store 下載 StepFun 應用程式
加入社群: 在 https://discord.gg/RcMJhNVAQc 加入 Discord 社群以獲取更新和支援
Step 3.5 Flash 常見問題
Step 3.5 Flash 是一個開源基礎模型,專為前沿推理和代理能力而設計。它採用稀疏的混合專家 (MoE) 架構,每個 token 僅激活其 1960 億個參數中的 110 億個。它擅長深度推理、編碼和代理任務,生成速度為每秒 100-300 個 token。











