Mercury là mô hình ngôn ngữ lớn dựa trên khuếch tán (dLLM) quy mô thương mại đầu tiên có thể tạo văn bản nhanh hơn tới 10 lần so với LLM truyền thống trong khi vẫn duy trì đầu ra chất lượng cao.
https://www.inceptionlabs.ai/?ref=producthunt&utm_source=aipure
Mercury

Thông tin Sản phẩm

Đã cập nhật:Feb 28, 2026

Mercury là gì

Mercury là một mô hình AI đột phá được phát triển bởi Inception Labs, thể hiện một sự thay đổi cơ bản từ các mô hình ngôn ngữ tự hồi quy truyền thống sang tạo văn bản dựa trên khuếch tán. Được ra mắt vào tháng 2 năm 2025, Mercury và phiên bản chuyên biệt về mã của nó là Mercury Coder có sẵn thông qua Amazon Bedrock Marketplace và Amazon SageMaker JumpStart. Họ mô hình được tạo ra bởi một nhóm các nhà nghiên cứu từ Stanford, UCLA và Cornell, những người tiên phong trong công việc khuếch tán nền tảng. Mercury được thiết kế để xử lý các tác vụ khác nhau bao gồm tạo mã, suy luận và các ứng dụng giọng nói thời gian thực.

Các Tính năng Chính của Mercury

Mercury là một Mô hình Ngôn ngữ Lớn (dLLM) dựa trên khuếch tán đột phá được phát triển bởi Inception Labs, về cơ bản thay đổi cách các mô hình ngôn ngữ tạo ra văn bản. Không giống như các mô hình tự hồi quy truyền thống tạo văn bản tuần tự, Mercury tạo ra nhiều mã thông báo song song, đạt tốc độ trên 1.000 mã thông báo mỗi giây trên GPU NVIDIA tiêu chuẩn trong khi vẫn duy trì đầu ra chất lượng cao. Nó cung cấp các khả năng cấp doanh nghiệp bao gồm cửa sổ ngữ cảnh 128K mã thông báo, hỗ trợ gọi công cụ và khả năng tương thích với các nền tảng đám mây lớn như AWS Bedrock và Azure AI Foundry.
Tạo mã thông báo song song: Sử dụng kiến trúc dựa trên khuếch tán để tạo nhiều mã thông báo đồng thời thay vì tạo tuần tự, cho phép xử lý nhanh hơn 5-10 lần so với LLM truyền thống
Tích hợp nền tảng đám mây: Có sẵn thông qua các nhà cung cấp đám mây lớn bao gồm AWS Bedrock và Azure AI Foundry với độ tin cậy cấp doanh nghiệp và thời gian hoạt động 99,5%+
Khả năng tương thích API: Duy trì khả năng tương thích với OpenAI API và hỗ trợ các phương pháp nhắc nhở tiêu chuẩn (zero-shot, few-shot, CoT), biến nó thành một sự thay thế trực tiếp cho các quy trình làm việc LLM hiện có
Khả năng lý luận nâng cao: Có quy trình tinh chỉnh nhiều bước giúp phát hiện lỗi và cải thiện sự mạch lạc trong quá trình tạo văn bản, đặc biệt mạnh mẽ trong các tác vụ mã hóa và lý luận toán học

Các Trường hợp Sử dụng của Mercury

Phát triển mã: Cung cấp khả năng hoàn thành mã theo thời gian thực, các đề xuất tab thông minh và chỉnh sửa mã nhanh chóng trong môi trường phát triển với độ trễ cực thấp
Tìm kiếm doanh nghiệp: Cho phép truy xuất và tóm tắt dữ liệu tức thì trên các cơ sở kiến thức tổ chức lớn với độ trễ tối thiểu
Ứng dụng thoại theo thời gian thực: Hỗ trợ các quy trình làm việc hỗ trợ giọng nói đáp ứng bao gồm hỗ trợ khách hàng, dịch vụ dịch thuật và các tác nhân thoại tương tác
Quy trình làm việc tự động: Xử lý các quy trình định tuyến, phân tích và quyết định phức tạp trong môi trường doanh nghiệp với các khả năng AI siêu nhạy

Ưu điểm

Tốc độ xử lý nhanh hơn đáng kể (hơn 1000 mã thông báo mỗi giây)
Chi phí suy luận thấp hơn so với LLM truyền thống
Khả năng tương thích trực tiếp với các quy trình làm việc LLM hiện có

Nhược điểm

Hồ sơ theo dõi hạn chế như một công nghệ mới
Hiện tại chủ yếu tập trung vào mã hóa và các ứng dụng doanh nghiệp
Yêu cầu phần cứng GPU cụ thể để có hiệu suất tối ưu

Cách Sử dụng Mercury

Tạo một tài khoản: Truy cập platform.inceptionlabs.ai và tạo một tài khoản Inception Platform hoặc đăng nhập nếu bạn đã có
Lấy khóa API: Đi tới phần Khóa API trong bảng điều khiển tài khoản của bạn và tạo một khóa API mới. Các khóa API mới đi kèm với 10 triệu mã thông báo miễn phí
Chọn phương pháp triển khai: Bạn có thể truy cập Mercury thông qua tích hợp API trực tiếp, Amazon Bedrock Marketplace, Amazon SageMaker JumpStart hoặc Azure AI Foundry tùy thuộc vào nhu cầu của bạn
Thực hiện các lệnh gọi API: Sử dụng khóa API để thực hiện các lệnh gọi đến các điểm cuối API của Mercury. API tương thích với OpenAI và có thể được truy cập thông qua các lệnh gọi REST hoặc các thư viện ứng dụng khách OpenAI hiện có
Ví dụ sử dụng API cơ bản: Thực hiện yêu cầu POST tới https://api.inceptionlabs.ai/v1/chat/completions với khóa API của bạn trong tiêu đề Authorization và tải trọng JSON chứa model (ví dụ: \'mercury-2\') và tin nhắn
Định cấu hình cài đặt: Tùy chọn đặt các tham số như max_tokens và bật trực quan hóa phát trực tuyến/khuếch tán bằng cách đặt tham số khuếch tán thành true
Tích hợp với các công cụ: Mercury có thể được tích hợp với các công cụ và khung phổ biến bao gồm LangChain, AISuite và LiteLLM cho các ứng dụng phức tạp hơn
Theo dõi việc sử dụng: Theo dõi việc sử dụng mã thông báo của bạn thông qua bảng điều khiển nền tảng. Mã thông báo đầu vào có giá $0,25 trên 1 triệu mã thông báo và mã thông báo đầu ra có giá $0,75 trên 1 triệu mã thông báo
Nhận hỗ trợ: Đối với các vấn đề hoặc câu hỏi, hãy liên hệ [email protected] hoặc tham gia kênh Discord của họ. Khách hàng doanh nghiệp có thể liên hệ [email protected]

Câu hỏi Thường gặp về Mercury

Mercury là Mô hình Ngôn ngữ Lớn (dLLM) dựa trên khuếch tán thương mại đầu tiên được Inception Labs ra mắt vào tháng 2 năm 2025. Nó sử dụng phương pháp tiếp cận dựa trên khuếch tán đột phá để tạo ngôn ngữ thay vì tạo tự hồi quy truyền thống.

Công cụ AI Mới nhất Tương tự Mercury

Foundry
Foundry
Contact for PricingAI Code GeneratorGame Tools
Foundry là một nền tảng linh hoạt tồn tại dưới nhiều hình thức - như một công cụ phát triển hợp đồng thông minh, phần mềm trò chơi bảng ảo, và một cơ sở đúc kim loại truyền thống - mỗi cái đều cung cấp các tính năng chuyên biệt cho các lĩnh vực tương ứng của chúng.
PythonConvert.com
PythonConvert.com
PythonConvert.com là một công cụ miễn phí dựa trên web cung cấp dịch vụ dịch mã được hỗ trợ bởi AI giữa Python và các ngôn ngữ lập trình khác cũng như khả năng chuyển đổi kiểu Python.
Softgen
Softgen
Softgen.ai là một nền tảng tạo dự án full-stack hỗ trợ AI cho phép người dùng biến ý tưởng của họ thành các ứng dụng web chức năng mà không cần yêu cầu lập trình.
Micro SaaS Ideas
Micro SaaS Ideas
Ý tưởng Micro SaaS là các giải pháp phần mềm quy mô nhỏ, tập trung vào ngách, nhắm đến các vấn đề hoặc thị trường cụ thể, cung cấp cho các doanh nhân một cách để xây dựng các doanh nghiệp có lợi nhuận với tài nguyên và độ phức tạp tối thiểu.