Mercury 是第一個商業規模的基於擴散的大型語言模型 (dLLM),它可以比傳統 LLM 快 10 倍的速度生成文字,同時保持高品質的輸出。
https://www.inceptionlabs.ai/?ref=producthunt&utm_source=aipure
Mercury

產品資訊

更新時間:2026年02月28日

什麼是 Mercury

Mercury 是 Inception Labs 開發的一款突破性 AI 模型,代表著從傳統的自迴歸語言模型到基於擴散的文字生成方式的根本轉變。Mercury 及其程式碼專業版本 Mercury Coder 於 2025 年 2 月推出,可透過 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 取得。該模型系列由來自史丹佛大學、加州大學洛杉磯分校和康乃爾大學的研究人員團隊創建,他們率先進行了基礎擴散工作。Mercury 旨在處理各種任務,包括程式碼生成、推理和即時語音應用。

Mercury 的主要功能

Mercury是由Inception Labs開發的一款突破性的基於擴散的大型語言模型(dLLM),它從根本上改變了語言模型生成文本的方式。與傳統的自迴歸模型按順序生成文本不同,Mercury並行生成多個token,在標準NVIDIA GPU上實現每秒超過1,000個token的速度,同時保持高品質的輸出。它提供企業級功能,包括128K token上下文窗口、工具調用支持,以及與主要雲平台(如AWS Bedrock和Azure AI Foundry)的兼容性。
並行Token生成: 使用基於擴散的架構同時生成多個token,而不是按順序生成,從而實現比傳統LLM快5-10倍的處理速度
雲平台集成: 通過包括AWS Bedrock和Azure AI Foundry在內的主要雲提供商提供,具有企業級可靠性和99.5%以上的正常運行時間
API兼容性: 保持OpenAI API兼容性,並支持標準提示方法(零樣本、少樣本、CoT),使其成為現有LLM工作流程的直接替代品
高級推理能力: 具有多步驟細化過程,可以在文本生成過程中捕獲錯誤並提高連貫性,在編碼和數學推理任務中尤其強大

Mercury 的使用案例

程式碼開發: 在具有超低延遲的開發環境中,為即時程式碼完成、智能標籤建議和快速程式碼編輯提供支持
企業搜索: 能夠以最小的延遲在大型組織知識庫中實現即時數據檢索和摘要
即時語音應用: 支持響應式語音驅動的工作流程,包括客戶支持、翻譯服務和互動式語音代理
自動化工作流程: 在企業環境中處理複雜的路由、分析和決策過程,並具有超響應的AI功能

優點

顯著更快的處理速度(每秒1000+個token)
與傳統LLM相比,更低的推理成本
與現有LLM工作流程的直接兼容性

缺點

作為一項新技術,追蹤記錄有限
目前主要專注於編碼和企業應用
需要特定的GPU硬件才能獲得最佳性能

如何使用 Mercury

建立帳戶: 造訪 platform.inceptionlabs.ai 並建立一個 Inception Platform 帳戶,或者如果您已經有帳戶,請登入
取得 API 金鑰: 前往您帳戶儀表板中的 API 金鑰部分,並建立一個新的 API 金鑰。新的 API 金鑰附帶 1000 萬個免費 Token
選擇部署方法: 您可以透過直接 API 整合、Amazon Bedrock Marketplace、Amazon SageMaker JumpStart 或 Azure AI Foundry 存取 Mercury,具體取決於您的需求
發出 API 呼叫: 使用 API 金鑰呼叫 Mercury API 端點。該 API 與 OpenAI 相容,並且可以透過 REST 呼叫或現有的 OpenAI 用戶端程式庫存取
基本 API 使用範例: 向 https://api.inceptionlabs.ai/v1/chat/completions 發出 POST 請求,並在 Authorization 標頭中包含您的 API 金鑰,以及包含模型(例如 'mercury-2')和訊息的 JSON 酬載
設定組態: 您可以選擇設定 max_tokens 等參數,並透過將 diffusing 參數設定為 true 來啟用串流/擴散視覺化
與工具整合: Mercury 可以與流行的工具和框架整合,包括 LangChain、AISuite 和 LiteLLM,以實現更複雜的應用
監控使用情況: 透過平台儀表板追蹤您的 Token 使用情況。輸入 Token 的成本為每 100 萬個 Token 0.25 美元,輸出 Token 的成本為每 100 萬個 Token 0.75 美元
取得支援: 如有問題,請聯絡 [email protected] 或加入他們的 Discord 頻道。企業客戶可以聯絡 [email protected]

Mercury 常見問題

Mercury 是 Inception Labs 於 2025 年 2 月推出的首個商用擴散型大型語言模型 (dLLM)。它採用突破性的基於擴散的方法進行語言生成,而不是傳統的自迴歸生成。

与 Mercury 类似的最新 AI 工具

Foundry
Foundry
Contact for PricingAI Code GeneratorGame Tools
Foundry 是一個多功能平台,以多種形式存在——作為智能合約開發工具鏈、虛擬桌面遊戲軟件和傳統金屬鑄造設施——每個版本都為其特定領域提供專業化功能。
PythonConvert.com
PythonConvert.com
PythonConvert.com 是一個免費的基於網頁的工具,提供 AI 驅動的 Python 和其他編程語言之間的代碼翻譯以及 Python 類型轉換功能。
Softgen
Softgen
Softgen.ai 是一個 AI 驅動的全棧項目生成平台,使用戶能夠在沒有編碼要求的情況下將其想法轉化為功能完整的網頁應用程序。
Micro SaaS Ideas
Micro SaaS Ideas
Micro SaaS 想法是小規模、細分市場專注的軟件解決方案,針對特定問題或市場,為創業者提供了一種以最少的資源和複雜性建立盈利業務的方式。