
MiniMax-M2.5
MiniMax-M2.5是一款前沿AI模型,在编码、工具使用和办公工作方面实现了最先进的性能,同时提供了前所未有的成本效益,价格仅为同类模型的1/10到1/20。
https://www.minimax.io/news/minimax-m25?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年02月28日
什么是 MiniMax-M2.5
MiniMax-M2.5于2026年2月发布,是一款先进的语言模型,建立在M2系列架构之上,总参数为2300亿,每次前向传递的活跃参数为100亿。该模型取得了令人印象深刻的基准分数,包括SWE-Bench Verified上的80.2%、Multi-SWE-Bench上的51.3%和BrowseComp上的76.3%,使其与Claude Opus 4.6等领先模型直接竞争。它有两个版本:标准版以每秒50个tokens的速度运行,Lightning版以每秒100个tokens的速度运行,这两种版本都旨在以大幅降低的成本提供高端AI功能。
MiniMax-M2.5 的主要功能
MiniMax-M2.5是一款先进的AI模型,于2026年2月发布,擅长编码、智能体工具使用和办公工作。它在超过200,000个真实世界环境中进行了广泛的强化学习,在SWE-Bench Verified上实现了80.2%的成绩,并以高速(100个tokens/秒)运行,同时保持了非常低的成本(最高速度下1美元/小时)。该模型支持204,800个tokens的上下文窗口,并且可以处理跨多个平台和编程语言的复杂任务。
高级强化学习: 使用专有的Forge RL框架,在包括代码存储库、浏览器和办公应用程序在内的200,000多个真实环境中进行训练
经济高效的性能: 以1/10到1/20的成本提供与Claude Opus 4.6等顶级模型相当的性能,在50个tokens/秒的速度下,费率低至每小时0.30美元
全面的编程支持: 支持10多种编程语言,并处理从系统设计到跨多个平台(Web、Android、iOS、Windows)的测试的完整开发生命周期
办公室技能集成: 专门从事办公任务,具有内置的Word格式化、PowerPoint编辑和Excel财务建模技能,这些技能是在行业专业人士的投入下开发的
MiniMax-M2.5 的使用场景
软件开发: 完整的软件开发生命周期管理,包括系统设计、编码、测试和跨多个平台和语言的审查
财务分析: 在Excel中创建复杂的财务模型和相互连接的电子表格,遵循特定的风险控制逻辑和计算标准
研究和文档: 进行行业研究,组织分析逻辑,并按照既定框架自动生成格式正确的调查报告
办公室自动化: 处理各种办公任务,包括文档格式化、演示文稿创建和电子表格操作,并提供专业级的输出
优点
与竞争对手相比,极具成本效益
高处理速度(高达每秒100个tokens)
全面支持多种编程语言和平台
在现实世界的办公任务中表现出色
缺点
一些用户报告与其他模型相比,代码质量不一致
对基准测试结果的独立验证有限
需要针对不同区域的特定环境变量配置
如何使用 MiniMax-M2.5
选择访问方式: 您有三个主要选项来访问MiniMax-M2.5:API、MiniMax Agent平台或自托管部署
API访问设置: 访问https://platform.minimax.io/docs/api-reference/text-anthropic-api以获取API访问权限。将基本URL设置为https://api.minimax.io/v1(国际用户)或https://api.minimaxi.com/v1(中国用户)
获取API密钥: 在MiniMax开发者平台上注册以获取您的API密钥。该平台为新用户提供慷慨的介绍性信用额度
配置模型参数: 使用推荐的参数:temperature=1.0,top_p=0.95,top_k=40,以获得最佳性能
选择模型版本: 在标准M2.5(每秒50个tokens,每小时0.30美元)或M2.5-Lightning(每秒100个tokens,每小时1美元)之间选择
MiniMax Agent设置(替代方法): 访问https://agent.minimax.io以访问由M2.5驱动的通用Agent产品,该产品在有限时间内免费
自托管设置(替代方法): 在Hugging Face上根据修改后的MIT许可证访问开放权重。未量化的bf16版本需要457GB,3-bit GGUF版本需要101GB
配置环境: 对于本地部署,使用带有适当参数(包括tensor-parallel-size和tool-call-parser设置)的vllm serve命令
MAX模式配置(可选): 处理办公任务时启用MAX模式,以根据文件类型(Word、PowerPoint、Excel)自动加载相应的办公技能
MiniMax-M2.5 常见问题
MiniMax-M2.5在SWE-Bench Verified中达到80.2%,在Multi-SWE-Bench中达到51.3%,在BrowseComp中达到76.3%。它的性能与Claude Opus 4.6相当,并在编码、代理工具使用、搜索和办公工作任务中表现出SOTA性能。











