DeepSeek-R1
DeepSeek-R1 是一个先进的开源 AI 推理模型,在数学、代码和推理任务中实现了与 OpenAI 的 o1 相当的性能,采用了创新的强化学习技术,并提供了多种精简版本以提高可访问性。
https://github.com/deepseek-ai/DeepSeek-R1?ref=aipure&utm_source=aipure
产品信息
更新于:2025年01月22日
什么是 DeepSeek-R1
DeepSeek-R1 是由 DeepSeek AI 开发的第一代推理模型,主要分为两个版本:DeepSeek-R1-Zero 和 DeepSeek-R1。该模型基于混合专家(MoE)架构,总参数量为 6710 亿,激活参数量为 370 亿,代表了 AI 推理能力的重大突破。该模型通过链式思维过程处理复杂推理任务,可处理长达 128K 个 token 的上下文。它既可以通过 DeepSeek 的聊天平台使用,也可以作为开源模型使用,提供多种精简版本,参数量从 15 亿到 700 亿不等,基于 Llama 和 Qwen 架构。
DeepSeek-R1 的主要功能
DeepSeek-R1 是一个先进的开源 AI 推理模型,在数学、代码和推理任务上达到了与 OpenAI 的 o1 模型相当的性能。它使用大规模强化学习进行训练,并具有独特的架构,能够实现逐步推理、自我验证和反思能力。该模型已基于 Llama 和 Qwen 被蒸馏成更小的版本,使其更加易于访问,同时保持强大的性能。
高级推理能力: 采用链式思维推理,具有自我验证和反思模式,能够透明地进行逐步问题解决
大规模强化学习训练: 首次开放研究验证,推理能力可以通过纯粹的强化学习而无需监督微调来发展
灵活的模型选项: 通过蒸馏提供多种大小(1.5B 到 70B 参数),满足不同计算需求的同时保持强大性能
扩展的上下文长度: 支持长达 128K 个 token 的上下文长度,能够处理更长的输入并生成更详细的响应
DeepSeek-R1 的使用场景
高级数学问题解决: 在解决复杂的数学问题方面表现出色,包括 AIME 和 MATH-500 基准测试,能够进行逐步推理
软件开发和编程: 执行高级编程任务、竞赛编程问题和软件工程挑战,具有很高的准确性
教育辅助: 通过提供详细解释和跨学科的逐步问题解决方法,帮助学生和教育工作者
多语言推理任务: 能够处理英语和中文的复杂推理任务,使其在国际应用中具有重要价值
优点
开源并可在 MIT 许可下商业使用
性能与 OpenAI 的 o1 等专有模型相当
提供多种大小以满足不同的计算需求
缺点
大型模型需要大量的计算资源
温度设置需要仔细调整以防止重复
不支持系统提示 - 所有指令必须在用户提示中
如何使用 DeepSeek-R1
选择访问方式: 您有三种方式访问 DeepSeek-R1:Web 界面、API 或本地安装
Web 界面访问: 访问 chat.deepseek.com,登录并启用 'DeepThink' 按钮以与 DeepSeek-R1 互动。注意:高级模式下每天限 50 条消息
API 访问: 1. 在 platform.deepseek.com 注册以获取 API 密钥 2. 使用与 OpenAI 兼容的 API,指定 model='deepseek-reasoner' 3. 将 base_url 设置为 https://api.deepseek.com/v1
本地安装(精简模型): 安装 vLLM 或 SGLang 以在本地运行较小的精简版本。对于 vLLM,使用:'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'
配置使用设置: 将温度设置在 0.5-0.7 之间(推荐 0.6),避免系统提示,将指令包含在用户提示中,对于数学问题添加 '\\boxed{}' 指令
选择模型版本: 根据您的计算资源选择 DeepSeek-R1-Zero(纯 RL 模型)、DeepSeek-R1(完整模型)或精简版本(基于 Qwen/Llama)
格式化提示: 在用户提示中包含所有指令,不要使用系统提示。对于数学问题,请求最终答案在 \\boxed{} 中
生成多个响应: 为了获得最佳效果,生成多个响应并在评估模型性能时取平均值
DeepSeek-R1 常见问题
DeepSeek-R1 是由 DeepSeek-AI 开发的第一代推理模型,在数学、代码和推理任务上实现了与 OpenAI-o1 相当的性能。它使用大规模强化学习进行训练,包括两个版本:DeepSeek-R1-Zero 和 DeepSeek-R1。