Thông số kỹ thuật của mô hình DeepSeek-R1 là gì?

DeepSeek-R1 có tổng cộng 671B tham số với 37B tham số được kích hoạt. Nó sử dụng kiến trúc MoE (Mixture of Experts) và có độ dài ngữ cảnh là 128K token.

DeepSeek-R1 có mã nguồn mở không và giấy phép của nó là gì?

Có, DeepSeek-R1 hoàn toàn mã nguồn mở và được cấp phép theo Giấy phép MIT. Nó hỗ trợ sử dụng thương mại và cho phép bất kỳ sửa đổi và tác phẩm phái sinh nào, bao gồm cả việc chưng cất để đào tạo các LLM khác.

Tôi có thể sử dụng DeepSeek-R1 như thế nào?

Bạn có thể sử dụng DeepSeek-R1 qua nhiều kênh: 1) Trò chuyện với nó trên trang web chính thức chat.deepseek.com 2) Sử dụng API tương thích với OpenAI của họ tại platform.deepseek.com 3) Chạy nó cục bộ bằng cách làm theo hướng dẫn trong kho lưu trữ DeepSeek-V3.

Điều gì làm cho DeepSeek-R1 trở nên độc đáo?

DeepSeek-R1 nổi bật vì là nghiên cứu mở đầu tiên xác thực rằng khả năng suy luận của các LLM có thể được khuyến khích hoàn toàn thông qua học tăng cường mà không cần tinh chỉnh giám sát. Nó thể hiện các khả năng như tự xác minh, phản ánh và tạo ra chuỗi suy nghĩ dài.

DeepSeek-R1

Q: Các cài đặt được khuyến nghị để sử dụng DeepSeek-R1 là gì?

Các cài đặt được khuyến nghị bao gồm: 1) Đặt nhiệt độ giữa 0.5-0.7 (khuyến nghị 0.6) 2) Tránh các lời nhắc hệ thống và bao gồm tất cả các hướng dẫn trong lời nhắc của người dùng 3) Đối với các bài toán toán học, bao gồm chỉ thị '\boxed{}' 4) Thực hiện nhiều bài kiểm tra khi đánh giá hiệu suất.

WebsiteFreeLarge Language Models (LLMs)Research Tools

DeepSeek-R1 là một mô hình suy luận AI mã nguồn mở tiên tiến đạt được hiệu suất tương đương với o1 của OpenAI trong các nhiệm vụ toán học, lập trình và suy luận, với các kỹ thuật học tăng cường đổi mới và nhiều phiên bản tinh chế để dễ tiếp cận hơn.

Mạng xã hội & Email:

Truy cập Trang web

Quảng Cáo Công Cụ Này

https://chat.deepseek.com/coder?ref=aipure&utm_source=aipure

Tổng quan
Phân tích
Bài đăng chính thức
Video
Bài viết
Các lựa chọn thay thế

Thông tin Sản phẩm

Đã cập nhật:Jul 16, 2025

Xu hướng Lưu lượng Truy cập Hàng tháng của DeepSeek-R1

DeepSeek-R1 đã trải qua sự sụt giảm 11,9% về lưu lượng truy cập, có thể do những thách thức về quy định và lo ngại về quyền riêng tư tại Liên minh Châu Âu, đặc biệt là về việc chuyển dữ liệu sang Trung Quốc. Ủy viên Bảo vệ Dữ liệu Berlin đã cáo buộc DeepSeek vi phạm GDPR, điều này có thể đã khiến người dùng e ngại.

Xem lịch sử lưu lượng truy cập

DeepSeek-R1 là gì

DeepSeek-R1 là một mô hình suy luận thế hệ đầu tiên được phát triển bởi DeepSeek AI, có hai biến thể chính: DeepSeek-R1-Zero và DeepSeek-R1. Được xây dựng trên kiến trúc Mixture-of-Experts (MoE) với tổng số tham số là 671B và 37B tham số được kích hoạt, nó đại diện cho một bước đột phá quan trọng trong khả năng suy luận AI. Mô hình được thiết kế để xử lý các nhiệm vụ suy luận phức tạp thông qua các quy trình chuỗi suy nghĩ và có thể làm việc với độ dài ngữ cảnh là 128K token. Nó có sẵn cả qua nền tảng trò chuyện của DeepSeek và dưới dạng mô hình mã nguồn mở, với nhiều phiên bản tinh chế từ 1.5B đến 70B tham số dựa trên kiến trúc Llama và Qwen.

Các Tính năng Chính của DeepSeek-R1

DeepSeek-R1 là một mô hình lý luận AI mã nguồn mở tiên tiến đạt được hiệu suất tương đương với mô hình o1 của OpenAI trong các nhiệm vụ toán học, lập trình và lý luận. Nó được đào tạo bằng cách sử dụng học tăng cường quy mô lớn và có kiến trúc độc đáo cho phép lý luận từng bước, tự xác minh và khả năng phản ánh. Mô hình đã được chưng cất thành các phiên bản nhỏ hơn dựa trên Llama và Qwen, giúp nó dễ tiếp cận hơn trong khi vẫn duy trì hiệu suất mạnh mẽ.

Khả Năng Lý Luận Nâng Cao: Sử dụng lý luận chuỗi tư duy với các mẫu tự xác minh và phản ánh, cho phép giải quyết vấn đề một cách minh bạch từng bước

Đào Tạo RL Quy Mô Lớn: Nghiên cứu mở đầu tiên để xác thực rằng khả năng lý luận có thể được phát triển hoàn toàn thông qua học tăng cường mà không cần tinh chỉnh giám sát

Tùy Chọn Mô Hình Linh Hoạt: Có sẵn với nhiều kích thước thông qua chưng cất (1.5B đến 70B tham số), cung cấp các tùy chọn cho các yêu cầu tính toán khác nhau trong khi vẫn duy trì hiệu suất mạnh mẽ

Chiều Dài Ngữ Cảnh Mở Rộng: Hỗ trợ chiều dài ngữ cảnh lên đến 128K token, cho phép xử lý các đầu vào dài hơn và tạo ra các phản hồi chi tiết hơn

Các Trường hợp Sử dụng của DeepSeek-R1

Giải Quyết Vấn Đề Toán Học Nâng Cao: Xuất sắc trong việc giải quyết các vấn đề toán học phức tạp, bao gồm các tiêu chuẩn AIME và MATH-500, với lý luận từng bước

Phát Triển Phần Mềm và Lập Trình: Thực hiện các nhiệm vụ lập trình cấp cao, các vấn đề lập trình cạnh tranh và các thách thức kỹ thuật phần mềm với độ chính xác cao

Hỗ Trợ Giáo Dục: Giúp học sinh và giáo viên bằng cách cung cấp các giải thích chi tiết và cách tiếp cận giải quyết vấn đề từng bước trong nhiều môn học khác nhau

Nhiệm Vụ Lý Luận Đa Ngôn Ngữ: Xử lý các nhiệm vụ lý luận phức tạp bằng cả tiếng Anh và tiếng Trung, làm cho nó có giá trị cho các ứng dụng quốc tế

Ưu điểm

Mã nguồn mở và có thể sử dụng thương mại theo Giấy phép MIT

Hiệu suất tương đương với các mô hình độc quyền như o1 của OpenAI

Có sẵn với nhiều kích thước cho các nhu cầu tính toán khác nhau

Nhược điểm

Yêu cầu tài nguyên tính toán đáng kể cho các mô hình lớn hơn

Cài đặt nhiệt độ cần được điều chỉnh cẩn thận để ngăn chặn sự lặp lại

Không hỗ trợ hệ thống nhắc nhở - tất cả các hướng dẫn phải nằm trong nhắc nhở của người dùng

Cách Sử dụng DeepSeek-R1

Chọn Phương Thức Truy Cập: Bạn có ba tùy chọn để truy cập DeepSeek-R1: Giao Diện Web, API hoặc Cài Đặt Địa Phương

Truy Cập Giao Diện Web: Truy cập chat.deepseek.com, đăng nhập và bật nút 'DeepThink' để tương tác với DeepSeek-R1. Lưu ý: Giới hạn 50 tin nhắn mỗi ngày trong chế độ nâng cao

Truy Cập API: 1. Đăng ký tại platform.deepseek.com để nhận khóa API 2. Sử dụng API tương thích với OpenAI bằng cách chỉ định model='deepseek-reasoner' 3. Đặt base_url thành https://api.deepseek.com/v1

Cài Đặt Địa Phương (Các Mô Hình Tinh Chế): Cài đặt vLLM hoặc SGLang để chạy các phiên bản tinh chế nhỏ hơn tại địa phương. Đối với vLLM, sử dụng: 'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'

Cấu Hình Cài Đặt Sử Dụng: Đặt nhiệt độ giữa 0.5-0.7 (0.6 được khuyến nghị), tránh các lời nhắc hệ thống, bao gồm hướng dẫn trong các lời nhắc của người dùng, và đối với các vấn đề toán học, thêm chỉ thị '\boxed{}'

Chọn Phiên Bản Mô Hình: Chọn giữa DeepSeek-R1-Zero (mô hình RL thuần túy), DeepSeek-R1 (mô hình đầy đủ) hoặc các phiên bản tinh chế (dựa trên Qwen/Llama) dựa trên tài nguyên tính toán của bạn

Định Dạng Lời Nhắc: Bao gồm tất cả các hướng dẫn trong lời nhắc của người dùng mà không có lời nhắc hệ thống. Đối với các vấn đề toán học, yêu cầu câu trả lời cuối cùng trong \boxed{}

Tạo Nhiều Phản Hồi: Để có kết quả tốt nhất, tạo nhiều phản hồi và trung bình kết quả khi đánh giá hiệu suất mô hình

Câu hỏi Thường gặp về DeepSeek-R1

DeepSeek-R1 là một mô hình suy luận thế hệ đầu tiên được phát triển bởi DeepSeek-AI, đạt hiệu suất tương đương với OpenAI-o1 trong các nhiệm vụ toán học, mã và suy luận. Nó được đào tạo bằng cách sử dụng học tăng cường quy mô lớn và bao gồm hai phiên bản: DeepSeek-R1-Zero và DeepSeek-R1.

Bài đăng chính thức

Đang tải...

Video DeepSeek-R1

Bài viết liên quan

Cách Sử Dụng DeepSeek R1 671B Miễn Phí – 3 Phương Pháp Dễ Dàng

Cách Chạy DeepSeek Ngoại Tuyến Tại Máy Tính

DeepSeek-R1 và OpenAI O1: So sánh toàn diện giữa mô hình AI mã nguồn mở và độc quyền

Bài viết phổ biến

Grok ra mắt AI Companion—Ani & Rudi, với các Tính năng NSFW

Jul 16, 2025

SweetAI Chat so sánh với Secret Desires: Ứng dụng xây dựng AI Partner nào phù hợp với bạn? | 2025

Jul 10, 2025

Cách tạo video động vật AI lan truyền năm 2025: Hướng dẫn từng bước

Jul 3, 2025

Các lựa chọn thay thế hàng đầu cho SweetAI Chat năm 2025: So sánh các nền tảng AI Girlfriend & NSFW Chat tốt nhất

Jun 30, 2025

Phân tích Trang web DeepSeek-R1

Lưu lượng truy cập & Xếp hạng của DeepSeek-R1

363.6M

Lượt truy cập hàng tháng

Xếp hạng Toàn cầu

Xếp hạng Danh mục

Xu hướng Lưu lượng truy cập: Jan 2025-Jun 2025

Thông tin chi tiết về Người dùng DeepSeek-R1

00:04:48

Thời lượng Truy cập Trung bình

3.02

Số trang mỗi lần Truy cập

37.97%

Tỷ lệ Thoát của Người dùng

Khu vực Hàng đầu của DeepSeek-R1

CN: 35.39%

RU: 7.94%

US: 5.65%

BR: 5.03%

IN: 2.96%

Others: 43.03%

Công cụ AI Mới nhất Tương tự DeepSeek-R1

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI là một nền tảng đa năng được hỗ trợ bởi AI cung cấp hỗ trợ học tập cá nhân hóa, giải pháp kinh doanh và huấn luyện cuộc sống thông qua các tính năng như phân tích tài liệu, tạo bài kiểm tra, thẻ ghi nhớ và khả năng trò chuyện tương tác.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI là một giải pháp phần mềm tại chỗ cung cấp các công cụ giám sát, bảo mật và tối ưu hóa toàn diện cho các ứng dụng dựa trên LLM với các tính năng như theo dõi hành vi, phát hiện bất thường và tối ưu hóa hiệu suất.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI là một nền tảng được hỗ trợ bởi AI cung cấp khả năng tóm tắt một cú nhấp chuột cho nhiều loại nội dung bao gồm bài báo, tài liệu nghiên cứu và video, đồng thời cũng cung cấp khả năng điều phối đại lý AI tiên tiến cho các nhiệm vụ cụ thể theo miền.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS là một nền tảng AI cung cấp quyền truy cập vào nhiều mô hình ngôn ngữ tiên tiến như Gemini, GPT-4, Claude và Grok với giao diện trực quan để người dùng tương tác và so sánh các mô hình AI khác nhau.

Công cụ AI Phổ biến Giống DeepSeek-R1

ChatGPT

Large Language Models (LLMs)AI Chatbot

ChatGPT là một chatbot tiên tiến được phát triển bởi OpenAI, sử dụng xử lý ngôn ngữ tự nhiên để tham gia vào các cuộc trò chuyện giống như con người và hỗ trợ một loạt các nhiệm vụ.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT là một nguyên mẫu tìm kiếm được hỗ trợ bởi AI của OpenAI, cung cấp câu trả lời nhanh chóng, trò chuyện với các nguồn rõ ràng sử dụng các mô hình GPT.

Gemini 2.5 Pro Preview 05-06

Free TrialLarge Language Models (LLMs)AI Chatbot

Gemini là gia đình mô hình AI đa phương thức tiên tiến và mạnh mẽ nhất của Google có thể hiểu và suy luận liền mạch qua văn bản, hình ảnh, video, âm thanh và mã để cung cấp sức mạnh cho nhiều ứng dụng và dịch vụ AI khác nhau.

OpenAI

Free TrialLarge Language Models (LLMs)

OpenAI là một công ty nghiên cứu trí tuệ nhân tạo hàng đầu phát triển các mô hình và công nghệ AI tiên tiến để mang lại lợi ích cho nhân loại.

Xếp hạng

Đăng & Quảng báNew