Mercury与其他LLM有何不同？

与其他一次按顺序生成一个token的LLM不同，Mercury使用扩散技术并行生成token。这使其比当前一代LLM快5-10倍，同时以更低的成本提供高质量的响应。

Mercury的定价详情是什么？

Mercury对输入收取每100万个token 0.25美元的费用，对输出收取每100万个token 0.75美元的费用，这不到Claude 4.5 Haiku等同类模型价格的四分之一。

Mercury的主要应用有哪些？

Mercury特别适用于编码任务（具有响应式自动完成和智能标签建议等功能）、实时语音应用程序、即时代理、跨组织知识库的快速搜索以及创意副驾驶功能。

有哪些可用的Mercury版本？

有两个主要版本：Mercury 2，它是最快的推理LLM，非常适合性能和速度至关重要的复杂应用程序；以及Mercury Edit，它是一个小型的、以编码为中心的dLLM，专为代码编辑和延迟敏感的编码工作流程而设计。

企业如何访问Mercury？

Mercury可通过主要的云提供商（如AWS Bedrock和Azure Foundry）获得。它与OpenAI API兼容，可以作为传统LLM的直接替代品。企业可以联系sales@inceptionlabs.ai获取企业解决方案。

Mercury

WebsitePaidAI Code Generator AI Voice Assistants

Mercury 是第一个商业规模的基于扩散的大型语言模型 (dLLM)，它可以比传统的 LLM 快 10 倍的速度生成文本，同时保持高质量的输出。

访问网站

推广此工具

https://www.inceptionlabs.ai/?ref=producthunt&utm_source=aipure

概述
视频
替代方案

产品信息

更新于：2026年03月08日

什么是 Mercury

Mercury 是 Inception Labs 开发的一款突破性 AI 模型，它代表了从传统的自回归语言模型到基于扩散的文本生成方式的根本转变。Mercury 及其代码专用版本 Mercury Coder 于 2025 年 2 月推出，可通过 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 获得。该模型系列由来自斯坦福大学、加州大学洛杉矶分校和康奈尔大学的研究人员团队创建，他们率先开展了基础扩散工作。Mercury 旨在处理各种任务，包括代码生成、推理和实时语音应用程序。

Mercury 的主要功能

Mercury是由Inception Labs开发的突破性扩散型大型语言模型（dLLM），从根本上改变了语言模型生成文本的方式。与传统的自回归模型按顺序生成文本不同，Mercury并行生成多个token，在标准NVIDIA GPU上实现每秒超过1,000个token的速度，同时保持高质量的输出。它提供企业级功能，包括128K token上下文窗口、工具调用支持以及与AWS Bedrock和Azure AI Foundry等主要云平台的兼容性。

并行Token生成: 使用基于扩散的架构同时生成多个token，而不是顺序生成，从而实现比传统LLM快5-10倍的处理速度

云平台集成: 通过包括AWS Bedrock和Azure AI Foundry在内的主要云提供商提供，具有企业级可靠性和99.5%以上的正常运行时间

API兼容性: 保持OpenAI API兼容性，并支持标准提示方法（零样本、少样本、CoT），使其成为现有LLM工作流程的直接替代品

高级推理能力: 具有多步骤细化过程，可在文本生成过程中捕获错误并提高连贯性，在编码和数学推理任务中尤其强大