
Mistral Medium 3.5
Mistral Medium 3.5 là mô hình đa phương thức dày đặc 128B, mã nguồn mở, hợp nhất hàng đầu của Mistral AI với cửa sổ ngữ cảnh 256K, được xây dựng để suy luận dài hạn, mã hóa và gọi công cụ/đầu ra có cấu trúc đáng tin cậy.
https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5?ref=producthunt&utm_source=aipure

Thông tin Sản phẩm
Đã cập nhật:May 18, 2026
Xu hướng Lưu lượng Truy cập Hàng tháng của Mistral Medium 3.5
Mistral Medium 3.5 đã nhận được 8.3m lượt truy cập trong tháng trước, thể hiện mức Tăng trưởng Nhẹ 7.4%. Dựa trên phân tích của chúng tôi, xu hướng này phù hợp với động lực thị trường điển hình trong lĩnh vực công cụ AI.
Xem lịch sử lưu lượng truy cậpMistral Medium 3.5 là gì
Mistral Medium 3.5 là một mô hình nền tảng “hợp nhất” hàng đầu mới từ Mistral AI (bản xem trước công khai) được thiết kế để hợp nhất việc tuân thủ hướng dẫn, suy luận và mã hóa trong một tập hợp trọng số duy nhất. Đây là một mô hình dày đặc 128B tham số với cửa sổ ngữ cảnh 256.000 token và hỗ trợ đầu vào đa phương thức (văn bản + hình ảnh, đầu ra văn bản). Được phát hành dưới dạng mã nguồn mở theo giấy phép MIT đã sửa đổi, nó được định vị để chạy các tác vụ năng suất và kỹ thuật phức tạp, dài hạn và hiện là mô hình mặc định đằng sau Le Chat của Mistral và tác nhân mã hóa Vibe.
Các Tính năng Chính của Mistral Medium 3.5
Mistral Medium 3.5 là mô hình "hợp nhất" hàng đầu có trọng số mở của Mistral AI, kết hợp khả năng tuân thủ hướng dẫn, suy luận và viết mã trong một mô hình dày đặc 128B tham số duy nhất với cửa sổ ngữ cảnh 256K. Nó được thiết kế cho công việc tác nhân, tầm nhìn dài (thực thi đa bước đáng tin cậy, gọi công cụ và đầu ra có cấu trúc), hỗ trợ đầu vào đa phương thức (văn bản + hình ảnh, đầu ra văn bản) và cung cấp nỗ lực suy luận có thể cấu hình theo yêu cầu. Nó cung cấp năng lượng cho các tác nhân mã hóa không đồng bộ dựa trên đám mây của Mistral trong Vibe và chế độ Làm việc mới trong Le Chat, đồng thời vẫn thực tế để tự lưu trữ (chỉ với bốn GPU) và có sẵn thông qua API và các tùy chọn triển khai như NVIDIA NIM.
Mô hình hàng đầu hợp nhất (hướng dẫn + suy luận + mã hóa): Hợp nhất khả năng tuân thủ hướng dẫn, suy luận sâu hơn và khả năng mã hóa trong một bộ trọng số, nhắm mục tiêu cả năng suất trò chuyện và quy trình làm việc mã hóa tác nhân.
Dày đặc 128B với cửa sổ ngữ cảnh 256K: Kiến trúc lớn, dày đặc được tối ưu hóa cho các hoạt động dài ổn định và đầu vào lớn (ví dụ: tài liệu dài hoặc ngữ cảnh cơ sở mã đáng kể) với cửa sổ 256.000 mã thông báo.
Nỗ lực suy luận có thể cấu hình: Độ sâu suy luận có thể được điều chỉnh theo yêu cầu, cho phép phản hồi nhanh cho các tác vụ đơn giản hoặc suy luận thận trọng hơn cho các hoạt động phức tạp, đa bước/tác nhân.
Độ tin cậy tác nhân: gọi công cụ + đầu ra có cấu trúc: Được xây dựng cho các tác vụ tầm nhìn dài liên quan đến việc gọi nhiều công cụ một cách đáng tin cậy và tạo ra đầu ra có cấu trúc (ví dụ: gọi JSON/hàm) mà các hệ thống hạ nguồn có thể sử dụng.
Đầu vào đa phương thức (văn bản + hình ảnh): Chấp nhận cả đầu vào văn bản và hình ảnh (với đầu ra văn bản), với bộ mã hóa tầm nhìn được đào tạo để xử lý các kích thước hình ảnh và tỷ lệ khung hình khác nhau.
Trọng số mở + tự lưu trữ thực tế: Được phát hành dưới dạng trọng số mở theo giấy phép MIT đã sửa đổi và được định vị là có thể tự lưu trữ trên chỉ bốn GPU, cùng với quyền truy cập API và triển khai được đóng gói (ví dụ: NVIDIA NIM).
Các Trường hợp Sử dụng của Mistral Medium 3.5
Kỹ thuật phần mềm không đồng bộ (tác nhân mã hóa từ xa): Chạy các tác vụ mã hóa dài trên đám mây thông qua các tác nhân từ xa của Vibe—tái cấu trúc, nâng cấp phụ thuộc, tạo thử nghiệm, điều tra CI và sửa lỗi—trả về kết quả dưới dạng nhánh hoặc PR nháp để xem xét.
Tự động hóa năng suất doanh nghiệp (chế độ Làm việc): Trong chế độ Làm việc của Le Chat, thực hiện các quy trình làm việc đa bước trên các công cụ được kết nối (tài liệu, email, lịch, trò chuyện), tổng hợp ngữ cảnh và soạn thảo đầu ra với các cổng phê duyệt của con người cho các hành động nhạy cảm.
Hỗ trợ khách hàng và phản hồi sự cố: Phân loại sự cố và các vấn đề hỗ trợ bằng cách phân tích nhật ký/vé, tóm tắt các giả thuyết nguyên nhân gốc rễ và tạo các bước khắc phục; tích hợp tốt với các quy trình làm việc dựa trên công cụ (ví dụ: trình theo dõi sự cố, hệ thống sự cố).
Phân tích viễn thông và vận hành: Áp dụng hiệu suất tác nhân và miền mạnh mẽ của mô hình (ví dụ: điểm τ³-Telecom) để hỗ trợ khắc phục sự cố, tổng hợp cơ sở kiến thức và tự động hóa quy trình làm việc trong bối cảnh hoạt động mạng.
Nghiên cứu và báo cáo nhiều tài liệu: Sử dụng cửa sổ ngữ cảnh 256K để nhập các bộ tài liệu nội bộ lớn và nghiên cứu web, sau đó tạo các bản tóm tắt, báo cáo hoặc bản ghi nhớ quyết định có cấu trúc phù hợp để chỉnh sửa và phân phối tiếp theo.
Hiểu biết trực quan cho các quy trình làm việc kinh doanh: Tận dụng đầu vào đa phương thức để diễn giải ảnh chụp màn hình, sơ đồ hoặc trạng thái giao diện người dùng và chuyển đổi chúng thành đầu ra văn bản có thể hành động (ví dụ: báo cáo lỗi, ghi chú triển khai hoặc hướng dẫn từng bước).
Ưu điểm
Trọng số mở theo giấy phép MIT đã sửa đổi, cho phép kiểm soát triển khai tốt hơn và các tùy chọn tự lưu trữ.
Được thiết kế cho công việc tác nhân tầm nhìn dài (gọi công cụ, đầu ra có cấu trúc, thực thi đa bước ổn định) với cửa sổ ngữ cảnh 256K lớn.
Dấu chân triển khai thực tế cho một mô hình đẳng cấp hàng đầu (được định vị là có thể tự lưu trữ trên chỉ bốn GPU) cộng với nhiều kênh phân phối (API, Vibe, Le Chat, NVIDIA NIM).
Nhược điểm
Trạng thái xem trước công khai có thể ngụ ý hành vi, công cụ và mức độ sẵn sàng của doanh nghiệp đang phát triển so với các bản phát hành hoàn toàn trưởng thành.
Các mô hình 128B dày đặc có thể tốn kém hơn để chạy ở suy luận so với các lựa chọn thay thế nhỏ hơn hoặc MoE, mặc dù đã cải thiện độ ổn định.
Một số trải nghiệm hàng đầu (ví dụ: tác nhân từ xa, chế độ Làm việc) được gắn với các gói trả phí (Pro/Team/Enterprise) và/hoặc hệ sinh thái của Mistral.
Cách Sử dụng Mistral Medium 3.5
1) Chọn cách bạn muốn chạy Mistral Medium 3.5: Chọn một trong các điểm truy cập được hỗ trợ tùy thuộc vào mục tiêu của bạn: (a) Le Chat để sử dụng tương tác và chế độ Làm việc (Xem trước), (b) Mistral Vibe CLI cho các quy trình làm việc của tác nhân mã hóa (cục bộ hoặc từ xa), (c) Mistral API để tích hợp ứng dụng, hoặc (d) tự lưu trữ/mã nguồn mở thông qua Hugging Face / NVIDIA NIM cho các triển khai tại chỗ hoặc được kiểm soát.
2) Sử dụng Mistral Medium 3.5 trong Le Chat (trò chuyện tương tác): Mở Le Chat (chat.mistral.ai). Mistral Medium 3.5 là mô hình mặc định trong Le Chat, vì vậy bạn có thể bắt đầu nhắc ngay lập tức để suy luận, trợ giúp mã hóa hoặc các tác vụ ngữ cảnh dài (nó hỗ trợ cửa sổ ngữ cảnh 256k).
3) Sử dụng chế độ Làm việc trong Le Chat (Xem trước) cho các tác vụ nhiều bước: Trong Le Chat, chuyển sang chế độ Làm việc (Xem trước) khi bạn cần thực hiện nhiều bước, dài hạn (nghiên cứu, phân tích, hành động đa công cụ). Chế độ Làm việc chạy một công cụ tác nhân chuyên dụng được cung cấp bởi Mistral Medium 3.5 và có thể gọi các công cụ song song cho đến khi công việc hoàn thành.
4) Phê duyệt các hành động nhạy cảm trong chế độ Làm việc: Khi tác nhân tiến hành, hãy xem xét các lệnh gọi công cụ và lý do hiển thị. Le Chat sẽ yêu cầu phê duyệt rõ ràng (dựa trên quyền của bạn) trước khi thực hiện các hành động nhạy cảm như gửi tin nhắn, viết tài liệu hoặc sửa đổi dữ liệu.
5) Bắt đầu phiên mã hóa từ Le Chat (quy trình làm việc Vibe Code): Từ trang chủ Le Chat, chạy quy trình làm việc Vibe Code (hoặc sử dụng phím tắt “New Code Session”). Nhập một lời nhắc tác vụ mã hóa rõ ràng (ví dụ: “sửa các thử nghiệm bị lỗi trong kho lưu trữ của tôi”). Điều này khởi chạy một phiên tác nhân mã hóa được cung cấp bởi Mistral Medium 3.5.
6) Sử dụng Mistral Vibe CLI cục bộ cho các tác vụ tác nhân mã hóa: Cài đặt và mở Mistral Vibe CLI. Định cấu hình khóa API của bạn bằng cách lưu nó vào ~/.vibe/.env để sử dụng lại. Chọn mô hình “mistral-medium-3.5” trong Vibe (nó thay thế Devstral 2 làm mô hình tác nhân mã hóa mặc định) và bắt đầu một tác vụ mã hóa tác nhân từ thiết bị đầu cuối của bạn.
7) Khởi chạy các tác nhân từ xa của Vibe (mã hóa đám mây không đồng bộ): Từ Vibe CLI hoặc Le Chat, bắt đầu một phiên tác nhân từ xa để chuyển các tác vụ dài sang đám mây. Các phiên chạy trong các hộp cát biệt lập, có thể chạy song song và tiếp tục hoạt động trong khi bạn rời đi. Bạn có thể kiểm tra tiến độ thông qua các lệnh gọi công cụ, khác biệt và cập nhật trạng thái.
8) Dịch chuyển một phiên Vibe cục bộ đang diễn ra lên đám mây: Nếu bạn bắt đầu một tác vụ cục bộ trong Vibe CLI và muốn nó tiếp tục không đồng bộ, hãy sử dụng khả năng dịch chuyển của Vibe để di chuyển phiên lên đám mây. Lịch sử phiên, trạng thái tác vụ và phê duyệt được chuyển tiếp; sau khi dịch chuyển, tiếp tục tương tác từ Le Chat (dịch chuyển là một chiều theo nguồn).
9) Xem xét đầu ra và các thay đổi trên GitHub (nhánh/PR): Khi tác nhân hoàn thành, nó có thể mở một nhánh và/hoặc một yêu cầu kéo dự thảo trên GitHub. Xem xét PR giống như bất kỳ tập hợp thay đổi nào khác; các cam kết, nhánh và PR dự thảo vẫn tồn tại trong kho lưu trữ của bạn.
10) Sử dụng Mistral API để tích hợp ứng dụng: Gọi Mistral Medium 3.5 thông qua Mistral API khi nhúng nó vào các sản phẩm. Đặt mô hình thành “mistral-medium-3.5” và sử dụng nó để tuân thủ hướng dẫn, suy luận, mã hóa và đầu ra có cấu trúc (lệnh gọi hàm gốc/đầu ra JSON được nhấn mạnh là điểm mạnh).
11) Cấu hình nỗ lực suy luận cho mỗi yêu cầu (sử dụng API): Khi sử dụng API, đặt “reasoning_effort” dựa trên độ phức tạp của tác vụ: sử dụng “high” cho các lời nhắc phức tạp và chạy tác nhân; sử dụng “none” cho các phản hồi nhanh, trực tiếp. Điều này cho phép cùng một mô hình hoạt động như một mô hình trò chuyện nhanh hoặc một công cụ suy luận sâu hơn.
12) Tự lưu trữ bằng cách sử dụng mã nguồn mở (Hugging Face) hoặc triển khai thông qua NVIDIA NIM: Nếu bạn cần tự lưu trữ, hãy tải xuống mã nguồn mở từ Hugging Face (được phát hành theo giấy phép MIT đã sửa đổi). Để triển khai sản xuất, bạn cũng có thể sử dụng NVIDIA NIM (dịch vụ vi mô suy luận được đóng gói) hoặc các điểm cuối do NVIDIA lưu trữ để tạo mẫu, như được đề cập trong thông báo chính thức.
Câu hỏi Thường gặp về Mistral Medium 3.5
Mistral Medium 3.5 là mô hình hợp nhất hàng đầu của Mistral AI (bản xem trước công khai kể từ ngày 29 tháng 4 năm 2026) kết hợp khả năng tuân thủ hướng dẫn, suy luận và mã hóa trong một mô hình dày đặc 128B duy nhất với cửa sổ ngữ cảnh 256k.
Bài viết phổ biến

Nano Banana SBTI: Nó là gì, Cách thức hoạt động và Cách sử dụng nó vào năm 2026
Apr 15, 2026

Đánh giá Atoms — Trình tạo sản phẩm AI định nghĩa lại việc tạo nội dung số vào năm 2026
Apr 10, 2026

Kilo Claw: Cách Triển Khai và Sử Dụng AI Agent "Làm-Thay-Bạn" Thực Sự (Cập Nhật 2026)
Apr 3, 2026

OpenAI Đóng Cửa Ứng Dụng Sora: Tương Lai Của Công Nghệ Tạo Video AI Năm 2026 Sẽ Ra Sao?
Mar 25, 2026
Phân tích Trang web Mistral Medium 3.5
Lưu lượng truy cập & Xếp hạng của Mistral Medium 3.5
8.3M
Lượt truy cập hàng tháng
#8656
Xếp hạng Toàn cầu
#9
Xếp hạng Danh mục
Xu hướng Lưu lượng truy cập: Oct 2024-Oct 2025
Thông tin chi tiết về Người dùng Mistral Medium 3.5
00:03:38
Thời lượng Truy cập Trung bình
2.95
Số trang mỗi lần Truy cập
43.14%
Tỷ lệ Thoát của Người dùng
Khu vực Hàng đầu của Mistral Medium 3.5
FR: 41.73%
RU: 6.79%
DE: 5.95%
US: 5.7%
IN: 2.9%
Others: 36.94%







