DeepSeek-R1 的模型规格是什么？

DeepSeek-R1 总共有 6710 亿个参数，其中 370 亿个参数被激活。它使用 MoE（专家混合）架构，上下文长度为 128K 个 token。

DeepSeek-R1 是否开源，其许可证是什么？

是的，DeepSeek-R1 是完全开源的，并且在 MIT 许可下发布。它支持商业使用，并允许任何修改和衍生作品，包括用于训练其他 LLM 的蒸馏。

使用 DeepSeek-R1 的推荐设置是什么？

推荐的设置包括：1) 将温度设置在 0.5-0.7 之间（推荐 0.6）2) 避免系统提示，将所有指令包含在用户提示中 3) 对于数学问题，包含 '\boxed{}' 指令 4) 在评估性能时进行多次测试。

DeepSeek-R1 有什么独特之处？

DeepSeek-R1 的独特之处在于它是第一个开放研究，验证了 LLM 的推理能力可以通过纯粹的强化学习来激励，而无需监督微调。它展示了自我验证、反思和生成长链思考的能力。

DeepSeek-R1

Q: 如何使用 DeepSeek-R1？

您可以通过多种渠道使用 DeepSeek-R1：1) 在官方网站 chat.deepseek.com 上与它聊天 2) 使用他们的 OpenAI 兼容 API，网址为 platform.deepseek.com 3) 按照 DeepSeek-V3 仓库中的说明在本地运行。

WebsiteFreeLarge Language Models (LLMs)Research Tools

DeepSeek-R1 是一个先进的开源 AI 推理模型，在数学、代码和推理任务中实现了与 OpenAI 的 o1 相当的性能，采用了创新的强化学习技术，并提供了多种精简版本以提高可访问性。

社交和电子邮件：

访问网站

推广此工具

https://chat.deepseek.com/coder?ref=aipure&utm_source=aipure

概述
分析
官方帖子
视频
文章
替代方案

产品信息

更新于：2025年07月16日

DeepSeek-R1 月度流量趋势

DeepSeek-R1 的流量下降了 11.9%，这可能是由于欧盟的监管挑战和隐私担忧，特别是关于数据向中国传输的问题。柏林数据保护专员指控 DeepSeek 违反了 GDPR，这可能导致用户望而却步。

查看历史流量

什么是 DeepSeek-R1

DeepSeek-R1 是由 DeepSeek AI 开发的第一代推理模型，主要分为两个版本：DeepSeek-R1-Zero 和 DeepSeek-R1。该模型基于混合专家（MoE）架构，总参数量为 6710 亿，激活参数量为 370 亿，代表了 AI 推理能力的重大突破。该模型通过链式思维过程处理复杂推理任务，可处理长达 128K 个 token 的上下文。它既可以通过 DeepSeek 的聊天平台使用，也可以作为开源模型使用，提供多种精简版本，参数量从 15 亿到 700 亿不等，基于 Llama 和 Qwen 架构。

DeepSeek-R1 的主要功能

DeepSeek-R1 是一个先进的开源 AI 推理模型，在数学、代码和推理任务上达到了与 OpenAI 的 o1 模型相当的性能。它使用大规模强化学习进行训练，并具有独特的架构，能够实现逐步推理、自我验证和反思能力。该模型已基于 Llama 和 Qwen 被蒸馏成更小的版本，使其更加易于访问，同时保持强大的性能。

高级推理能力: 采用链式思维推理，具有自我验证和反思模式，能够透明地进行逐步问题解决

大规模强化学习训练: 首次开放研究验证，推理能力可以通过纯粹的强化学习而无需监督微调来发展

灵活的模型选项: 通过蒸馏提供多种大小（1.5B 到 70B 参数），满足不同计算需求的同时保持强大性能

扩展的上下文长度: 支持长达 128K 个 token 的上下文长度，能够处理更长的输入并生成更详细的响应

DeepSeek-R1 的使用场景

高级数学问题解决: 在解决复杂的数学问题方面表现出色，包括 AIME 和 MATH-500 基准测试，能够进行逐步推理

软件开发和编程: 执行高级编程任务、竞赛编程问题和软件工程挑战，具有很高的准确性

教育辅助: 通过提供详细解释和跨学科的逐步问题解决方法，帮助学生和教育工作者

多语言推理任务: 能够处理英语和中文的复杂推理任务，使其在国际应用中具有重要价值

优点

开源并可在 MIT 许可下商业使用

性能与 OpenAI 的 o1 等专有模型相当

提供多种大小以满足不同的计算需求

缺点

大型模型需要大量的计算资源

温度设置需要仔细调整以防止重复

不支持系统提示 - 所有指令必须在用户提示中

如何使用 DeepSeek-R1

选择访问方式: 您有三种方式访问 DeepSeek-R1：Web 界面、API 或本地安装

Web 界面访问: 访问 chat.deepseek.com，登录并启用 'DeepThink' 按钮以与 DeepSeek-R1 互动。注意：高级模式下每天限 50 条消息

API 访问: 1. 在 platform.deepseek.com 注册以获取 API 密钥 2. 使用与 OpenAI 兼容的 API，指定 model='deepseek-reasoner' 3. 将 base_url 设置为 https://api.deepseek.com/v1

本地安装（精简模型）: 安装 vLLM 或 SGLang 以在本地运行较小的精简版本。对于 vLLM，使用：'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'

配置使用设置: 将温度设置在 0.5-0.7 之间（推荐 0.6），避免系统提示，将指令包含在用户提示中，对于数学问题添加 '\\boxed{}' 指令

选择模型版本: 根据您的计算资源选择 DeepSeek-R1-Zero（纯 RL 模型）、DeepSeek-R1（完整模型）或精简版本（基于 Qwen/Llama）

格式化提示: 在用户提示中包含所有指令，不要使用系统提示。对于数学问题，请求最终答案在 \\boxed{} 中

生成多个响应: 为了获得最佳效果，生成多个响应并在评估模型性能时取平均值