Step 3.5 Flash

Step 3.5 Flash 是一个开源基础模型,构建在稀疏的专家混合 (MoE) 架构之上,该架构有选择地激活每个令牌 196B 参数中的 11B,从而以卓越的效率提供前沿的推理和代理能力。
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure
Step 3.5 Flash

产品信息

更新于:2026年03月06日

什么是 Step 3.5 Flash

Step 3.5 Flash 是 StepFun 最强大的开源基础模型,旨在通过高级推理和工具使用能力将静态模型转变为主动代理。它支持 256K 上下文窗口,并通过三向多令牌预测 (MTP-3) 实现 100-300 个令牌/秒的生成吞吐量。该模型旨在通过云 API(通过 OpenRouter 和 StepFun 平台)以及在高端消费硬件(如 Mac Studio M4 Max 和 NVIDIA DGX Spark)上进行本地部署来访问。

Step 3.5 Flash 的主要功能

Step 3.5 Flash是由StepFun开发的尖端开源基础模型,它采用稀疏的混合专家(MoE)架构,每个token仅选择性地激活其1960亿个参数中的110亿个。它具有256K的上下文窗口,实现了每秒100-350个token的生成速度,并且擅长代理任务、数学推理、编码和深度研究,同时保持了高效率和本地部署的可访问性。
高效的参数使用: 使用稀疏的MoE架构,每个token仅激活1960亿个参数中的110亿个,从而在保持计算效率的同时实现高性能
高级推理能力: 在管理多阶段流程(包括数据摄取、清理、特征构建和结果解释)方面表现出卓越的熟练程度,在数学和编码基准上表现出色
高速处理: 在256K上下文窗口支持下,实现每秒100-350个token的生成吞吐量,由3路多token预测(MTP-3)提供支持
本地部署支持: 针对在高端个人硬件(如Apple M4 Max、NVIDIA DGX Spark或AMD AI Max+ 395)上进行本地部署进行了优化,从而确保私有和安全的执行

Step 3.5 Flash 的使用场景

专业数据分析: 处理端到端的数据分析任务,包括数据摄取、清理、特征构建和结果解释,用于商业智能应用
深度研究助理: 通过计划、搜索、反思和写作来进行全面的研究,在研究质量基准上获得高分,同时保持事实准确性
编码和开发: 协助软件开发,在编码基准上表现出色,能够处理复杂的编程任务和存储库架构分析
股票投资分析: 通过分析市场数据、技术指标以及通过与多个工具集成来管理自动警报,从而生成专业的交易建议

优点

通过选择性参数激活实现高效率
在多个基准测试中表现出色
支持本地部署以增强隐私
快速的推理速度,每秒100-350个token

缺点

与某些竞争对手相比,需要更长的生成轨迹
在分布偏移期间可能会降低稳定性
在高度专业化的领域中性能有限
在长期的多轮对话中可能会出现不一致

如何使用 Step 3.5 Flash

选择访问方式: 您可以通过以下方式访问 Step 3.5 Flash:1) OpenRouter 2) StepFun 平台 API 3) 通过 GGUF 格式进行本地部署
云 API 设置(选项 1 - OpenRouter): 在 OpenRouter 注册以获取您的 API 密钥。使用基本 URL:https://openrouter.ai/api/v1,模型:stepfun/step-3.5-flash
云 API 设置(选项 2 - StepFun 平台): 在 platform.stepfun.ai(国际)或 platform.stepfun.com(中国)注册。使用基本 URL:https://api.stepfun.ai/v1(国际)或 https://api.stepfun.com/v1(中国),模型:step-3.5-flash
安装 OpenClaw 以获得代理功能: 运行:curl -fsSL https://openclaw.ai/install.sh | bash
配置 OpenClaw: 1) 运行 'openclaw onboard' 2) 在 WebUI 中转到 Config → Models 3) 添加提供商,类型:openai-completions,基本 URL:https://api.stepfun.ai/v1
本地部署设置: 1) 从 Hugging Face 下载模型:stepfun-ai/Step-3.5-Flash-FP8 或 INT4 版本 2) 使用 vLLM 或 llama.cpp 进行推理 3) 需要高端硬件,如 NVIDIA DGX Spark 或 Apple M4 Max
Web 界面访问: 访问 stepfun.ai(国际)或 stepfun.com(中国)以使用 Web 界面
移动应用访问: 从 iOS App Store 或 Google Play Store 下载 StepFun 应用
加入社区: 加入 Discord 社区:https://discord.gg/RcMJhNVAQc 以获取更新和支持

Step 3.5 Flash 常见问题

Step 3.5 Flash是一个开源的基础模型,专为前沿推理和代理能力而设计。它采用稀疏的混合专家(MoE)架构,每个token仅激活其1960亿个参数中的110亿个。它擅长深度推理、编码和代理任务,生成速度为每秒100-300个token。

与 Step 3.5 Flash 类似的最新 AI 工具

Athena AI
Athena AI
Athena AI 是一个多功能的 AI 驱动平台,通过文档分析、测验生成、闪卡和互动聊天功能提供个性化学习辅助、商业解决方案和生活指导。
Aguru AI
Aguru AI
Aguru AI 是一个本地软件解决方案,为基于 LLM 的应用程序提供全面的监控、安全和优化工具,包括行为跟踪、异常检测和性能优化等功能。
GOAT AI
GOAT AI
GOAT AI 是一个 AI 驱动的平台,提供一键摘要功能,适用于新闻文章、研究论文和视频等各种内容类型,同时提供针对特定领域任务的高级 AI 代理编排。
GiGOS
GiGOS
GiGOS是一个AI平台,提供访问多个高级语言模型(如Gemini、GPT-4、Claude和Grok)的权限,并通过直观的界面让用户与不同的AI模型互动和比较。