Step 3.5 Flash

Step 3.5 Flash 是一個開源基礎模型,建立在稀疏的專家混合 (MoE) 架構之上,該架構有選擇地僅激活每個令牌 196B 參數中的 11B,從而以卓越的效率提供前沿的推理和代理能力。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure
Step 3.5 Flash

產品資訊

更新時間:2026年03月06日

什麼是 Step 3.5 Flash

Step 3.5 Flash 是 StepFun 最強大的開源基礎模型,旨在透過先進的推理和工具使用能力將靜態模型轉變為活動代理。它支援 256K 上下文視窗,並透過三向多令牌預測 (MTP-3) 實現 100-300 個令牌/秒的生成吞吐量。該模型旨在透過雲端 API(透過 OpenRouter 和 StepFun 平台)以及在 Mac Studio M4 Max 和 NVIDIA DGX Spark 等高端消費者硬體上進行本地部署來存取。

Step 3.5 Flash 的主要功能

Step 3.5 Flash是由StepFun開發的尖端開源基礎模型,採用稀疏的混合專家(MoE)架構,每個token僅選擇性地激活其1960億參數中的110億個。它具有256K的上下文窗口,實現每秒100-350個token的生成速度,並且擅長代理任務、數學推理、編碼和深度研究,同時保持高效率和本地部署的可訪問性。
高效的參數使用: 使用稀疏的MoE架構,每個token僅激活1960億參數中的110億個,從而在保持計算效率的同時實現高性能
高級推理能力: 在管理多階段流程(包括數據攝取、清理、特徵構建和結果解釋)方面表現出卓越的能力,在數學和編碼基準上表現出色
高速處理: 在256K上下文窗口的支持下,實現每秒100-350個token的生成吞吐量,由三向多token預測(MTP-3)提供支持
本地部署支持: 針對在高端個人硬件(如Apple M4 Max、NVIDIA DGX Spark或AMD AI Max+ 395)上進行本地部署進行了優化,從而確保私密和安全的執行

Step 3.5 Flash 的使用案例

專業數據分析: 處理端到端的數據分析任務,包括數據攝取、清理、特徵構建和結果解釋,適用於商業智能應用
深度研究助理: 通過規劃、搜索、反思和寫作進行全面的研究,在研究質量基準上取得高分,同時保持事實準確性
編碼和開發: 協助軟件開發,在編碼基準上表現出色,能夠處理複雜的編程任務和存儲庫架構分析
股票投資分析: 通過分析市場數據、技術指標以及通過與多種工具集成來管理自動警報,從而生成專業的交易建議

優點

通過選擇性參數激活實現高效率
在多個基準上表現出色
支持本地部署以增強隱私
快速的推理速度,每秒100-350個token

缺點

與某些競爭對手相比,需要更長的生成軌跡
在分佈轉移期間可能會降低穩定性
在高度專業化的領域中性能有限
在長期的多輪對話中可能會出現不一致

如何使用 Step 3.5 Flash

選擇存取方法: 您可以透過以下方式存取 Step 3.5 Flash:1) OpenRouter 2) StepFun 平台 API 3) 透過 GGUF 格式進行本地部署
雲端 API 設定(選項 1 - OpenRouter): 在 OpenRouter 註冊以取得您的 API 金鑰。使用基本 URL:https://openrouter.ai/api/v1,模型:stepfun/step-3.5-flash
雲端 API 設定(選項 2 - StepFun 平台): 在 platform.stepfun.ai(國際)或 platform.stepfun.com(中國)註冊。使用基本 URL:https://api.stepfun.ai/v1(國際)或 https://api.stepfun.com/v1(中國),模型:step-3.5-flash
安裝 OpenClaw 以獲得代理功能: 執行:curl -fsSL https://openclaw.ai/install.sh | bash
設定 OpenClaw: 1) 執行 'openclaw onboard' 2) 在 WebUI 中,前往 Config → Models 3) 新增提供者,類型:openai-completions,基本 URL:https://api.stepfun.ai/v1
本地部署設定: 1) 從 Hugging Face 下載模型:stepfun-ai/Step-3.5-Flash-FP8 或 INT4 版本 2) 使用 vLLM 或 llama.cpp 進行推論 3) 需要 NVIDIA DGX Spark 或 Apple M4 Max 等高端硬體
網頁介面存取: 造訪 stepfun.ai(國際)或 stepfun.com(中國)以使用網頁介面
行動應用程式存取: 從 iOS App Store 或 Google Play Store 下載 StepFun 應用程式
加入社群: 在 https://discord.gg/RcMJhNVAQc 加入 Discord 社群以獲取更新和支援

Step 3.5 Flash 常見問題

Step 3.5 Flash 是一個開源基礎模型,專為前沿推理和代理能力而設計。它採用稀疏的混合專家 (MoE) 架構,每個 token 僅激活其 1960 億個參數中的 110 億個。它擅長深度推理、編碼和代理任務,生成速度為每秒 100-300 個 token。

与 Step 3.5 Flash 类似的最新 AI 工具

Athena AI
Athena AI
Athena AI 是一個多功能的 AI 驅動平台,通過文檔分析、測驗生成、閃卡和互動聊天功能,提供個性化的學習協助、商業解決方案和生活輔導。
Aguru AI
Aguru AI
Aguru AI 是一個本地部署的軟件解決方案,為基於 LLM 的應用提供全面的監控、安全和優化工具,包括行為跟蹤、異常檢測和性能優化等功能。
GOAT AI
GOAT AI
GOAT AI 是一個 AI 驅動的平台,提供一鍵摘要功能,適用於新聞文章、研究論文和視頻等多種內容類型,同時還提供先進的 AI 代理編排,用於特定領域的任務。
GiGOS
GiGOS
GiGOS 是一個 AI 平台,提供多個先進的語言模型,如 Gemini、GPT-4、Claude 和 Grok,並通過直觀的界面讓用戶與不同的 AI 模型互動和比較。