Step 3.5 Flash
Step 3.5 Flash 是一个开源基础模型,构建在稀疏的专家混合 (MoE) 架构之上,该架构有选择地激活每个令牌 196B 参数中的 11B,从而以卓越的效率提供前沿的推理和代理能力。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年03月06日
什么是 Step 3.5 Flash
Step 3.5 Flash 是 StepFun 最强大的开源基础模型,旨在通过高级推理和工具使用能力将静态模型转变为主动代理。它支持 256K 上下文窗口,并通过三向多令牌预测 (MTP-3) 实现 100-300 个令牌/秒的生成吞吐量。该模型旨在通过云 API(通过 OpenRouter 和 StepFun 平台)以及在高端消费硬件(如 Mac Studio M4 Max 和 NVIDIA DGX Spark)上进行本地部署来访问。
Step 3.5 Flash 的主要功能
Step 3.5 Flash是由StepFun开发的尖端开源基础模型,它采用稀疏的混合专家(MoE)架构,每个token仅选择性地激活其1960亿个参数中的110亿个。它具有256K的上下文窗口,实现了每秒100-350个token的生成速度,并且擅长代理任务、数学推理、编码和深度研究,同时保持了高效率和本地部署的可访问性。
高效的参数使用: 使用稀疏的MoE架构,每个token仅激活1960亿个参数中的110亿个,从而在保持计算效率的同时实现高性能
高级推理能力: 在管理多阶段流程(包括数据摄取、清理、特征构建和结果解释)方面表现出卓越的熟练程度,在数学和编码基准上表现出色
高速处理: 在256K上下文窗口支持下,实现每秒100-350个token的生成吞吐量,由3路多token预测(MTP-3)提供支持
本地部署支持: 针对在高端个人硬件(如Apple M4 Max、NVIDIA DGX Spark或AMD AI Max+ 395)上进行本地部署进行了优化,从而确保私有和安全的执行
Step 3.5 Flash 的使用场景
专业数据分析: 处理端到端的数据分析任务,包括数据摄取、清理、特征构建和结果解释,用于商业智能应用
深度研究助理: 通过计划、搜索、反思和写作来进行全面的研究,在研究质量基准上获得高分,同时保持事实准确性
编码和开发: 协助软件开发,在编码基准上表现出色,能够处理复杂的编程任务和存储库架构分析
股票投资分析: 通过分析市场数据、技术指标以及通过与多个工具集成来管理自动警报,从而生成专业的交易建议
优点
通过选择性参数激活实现高效率
在多个基准测试中表现出色
支持本地部署以增强隐私
快速的推理速度,每秒100-350个token
缺点
与某些竞争对手相比,需要更长的生成轨迹
在分布偏移期间可能会降低稳定性
在高度专业化的领域中性能有限
在长期的多轮对话中可能会出现不一致
如何使用 Step 3.5 Flash
选择访问方式: 您可以通过以下方式访问 Step 3.5 Flash:1) OpenRouter 2) StepFun 平台 API 3) 通过 GGUF 格式进行本地部署
云 API 设置(选项 1 - OpenRouter): 在 OpenRouter 注册以获取您的 API 密钥。使用基本 URL:https://openrouter.ai/api/v1,模型:stepfun/step-3.5-flash
云 API 设置(选项 2 - StepFun 平台): 在 platform.stepfun.ai(国际)或 platform.stepfun.com(中国)注册。使用基本 URL:https://api.stepfun.ai/v1(国际)或 https://api.stepfun.com/v1(中国),模型:step-3.5-flash
安装 OpenClaw 以获得代理功能: 运行:curl -fsSL https://openclaw.ai/install.sh | bash
配置 OpenClaw: 1) 运行 'openclaw onboard' 2) 在 WebUI 中转到 Config → Models 3) 添加提供商,类型:openai-completions,基本 URL:https://api.stepfun.ai/v1
本地部署设置: 1) 从 Hugging Face 下载模型:stepfun-ai/Step-3.5-Flash-FP8 或 INT4 版本 2) 使用 vLLM 或 llama.cpp 进行推理 3) 需要高端硬件,如 NVIDIA DGX Spark 或 Apple M4 Max
Web 界面访问: 访问 stepfun.ai(国际)或 stepfun.com(中国)以使用 Web 界面
移动应用访问: 从 iOS App Store 或 Google Play Store 下载 StepFun 应用
加入社区: 加入 Discord 社区:https://discord.gg/RcMJhNVAQc 以获取更新和支持
Step 3.5 Flash 常见问题
Step 3.5 Flash是一个开源的基础模型,专为前沿推理和代理能力而设计。它采用稀疏的混合专家(MoE)架构,每个token仅激活其1960亿个参数中的110亿个。它擅长深度推理、编码和代理任务,生成速度为每秒100-300个token。











