
Mercury
Mercury 是第一个商业规模的基于扩散的大型语言模型 (dLLM),它可以比传统的 LLM 快 10 倍的速度生成文本,同时保持高质量的输出。
https://www.inceptionlabs.ai/?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年02月28日
什么是 Mercury
Mercury 是 Inception Labs 开发的一款突破性 AI 模型,它代表了从传统的自回归语言模型到基于扩散的文本生成方式的根本转变。Mercury 及其代码专用版本 Mercury Coder 于 2025 年 2 月推出,可通过 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 获得。该模型系列由来自斯坦福大学、加州大学洛杉矶分校和康奈尔大学的研究人员团队创建,他们率先开展了基础扩散工作。Mercury 旨在处理各种任务,包括代码生成、推理和实时语音应用程序。
Mercury 的主要功能
Mercury是由Inception Labs开发的突破性扩散型大型语言模型(dLLM),从根本上改变了语言模型生成文本的方式。与传统的自回归模型按顺序生成文本不同,Mercury并行生成多个token,在标准NVIDIA GPU上实现每秒超过1,000个token的速度,同时保持高质量的输出。它提供企业级功能,包括128K token上下文窗口、工具调用支持以及与AWS Bedrock和Azure AI Foundry等主要云平台的兼容性。
并行Token生成: 使用基于扩散的架构同时生成多个token,而不是顺序生成,从而实现比传统LLM快5-10倍的处理速度
云平台集成: 通过包括AWS Bedrock和Azure AI Foundry在内的主要云提供商提供,具有企业级可靠性和99.5%以上的正常运行时间
API兼容性: 保持OpenAI API兼容性,并支持标准提示方法(零样本、少样本、CoT),使其成为现有LLM工作流程的直接替代品
高级推理能力: 具有多步骤细化过程,可在文本生成过程中捕获错误并提高连贯性,在编码和数学推理任务中尤其强大
Mercury 的使用场景
代码开发: 在开发环境中,通过超低延迟为实时代码完成、智能标签建议和快速代码编辑提供支持
企业搜索: 支持跨大型组织知识库的即时数据检索和摘要,且延迟极低
实时语音应用: 支持响应迅速的语音驱动工作流程,包括客户支持、翻译服务和交互式语音代理
自动化工作流程: 在企业环境中,通过超响应的AI功能处理复杂的路由、分析和决策过程
优点
显著更快的处理速度(每秒1000+个token)
与传统LLM相比,推理成本更低
与现有LLM工作流程的直接兼容性
缺点
作为一项新技术,跟踪记录有限
目前主要侧重于编码和企业应用
需要特定的GPU硬件才能获得最佳性能
如何使用 Mercury
创建帐户: 访问 platform.inceptionlabs.ai 并创建一个 Inception Platform 帐户,或者如果您已经有帐户,请登录
获取 API 密钥: 转到您帐户仪表板中的 API 密钥部分,然后创建一个新的 API 密钥。新的 API 密钥附带 1000 万个免费令牌
选择部署方法: 您可以根据您的需求通过直接 API 集成、Amazon Bedrock Marketplace、Amazon SageMaker JumpStart 或 Azure AI Foundry 访问 Mercury
进行 API 调用: 使用 API 密钥调用 Mercury API 端点。该 API 与 OpenAI 兼容,可以通过 REST 调用或现有的 OpenAI 客户端库访问
基本 API 用法示例: 向 https://api.inceptionlabs.ai/v1/chat/completions 发送 POST 请求,并在 Authorization 标头中使用您的 API 密钥,以及包含模型(例如 'mercury-2')和消息的 JSON 有效负载
配置设置: 可以选择设置 max_tokens 等参数,并通过将 diffusing 参数设置为 true 来启用流式传输/扩散可视化
与工具集成: Mercury 可以与流行的工具和框架集成,包括 LangChain、AISuite 和 LiteLLM,以实现更复杂的应用程序
监控使用情况: 通过平台仪表板跟踪您的令牌使用情况。输入令牌的成本为每 100 万个令牌 0.25 美元,输出令牌的成本为每 100 万个令牌 0.75 美元
获取支持: 如有问题,请联系 [email protected] 或加入他们的 Discord 频道。企业客户可以联系 [email protected]
Mercury 常见问题
Mercury是由Inception Labs于2025年2月推出的首个商用扩散型大型语言模型(dLLM)。它采用突破性的基于扩散的方法进行语言生成,而不是传统的自回归生成。











