Quelles sont les spécifications du modèle DeepSeek-R1 ?

DeepSeek-R1 a 671B de paramètres au total avec 37B de paramètres activés. Il utilise une architecture MoE (Mixture of Experts) et a une longueur de contexte de 128K tokens.

DeepSeek-R1 est-il open source et quelle est sa licence ?

Oui, DeepSeek-R1 est entièrement open-source et sous licence MIT. Il prend en charge l'utilisation commerciale et permet toutes modifications et œuvres dérivées, y compris la distillation pour entraîner d'autres LLMs.

Comment puis-je utiliser DeepSeek-R1 ?

Vous pouvez utiliser DeepSeek-R1 par plusieurs canaux : 1) Discutez avec lui sur le site officiel chat.deepseek.com 2) Utilisez leur API compatible OpenAI à platform.deepseek.com 3) Exécutez-le localement en suivant les instructions dans le dépôt DeepSeek-V3.

Quels sont les paramètres recommandés pour utiliser DeepSeek-R1 ?

Les paramètres recommandés incluent : 1) Régler la température entre 0.5-0.7 (0.6 recommandé) 2) Éviter les invites système et inclure toutes les instructions dans les invites utilisateur 3) Pour les problèmes mathématiques, inclure la directive '\boxed{}' 4) Effectuer plusieurs tests lors de l'évaluation des performances.

DeepSeek-R1

Q: Qu'est-ce qui rend DeepSeek-R1 unique ?

DeepSeek-R1 est remarquable pour être la première recherche ouverte à valider que les capacités de raisonnement des LLMs peuvent être incitées uniquement par l'apprentissage par renforcement sans ajustement supervisé. Il démontre des capacités telles que l'auto-vérification, la réflexion et la génération de longues chaînes de pensées.

WebsiteFreeLarge Language Models (LLMs)Research Tools

DeepSeek-R1 est un modèle de raisonnement IA open-source avancé qui atteint des performances comparables à celles du o1 d'OpenAI dans les tâches de mathématiques, de code et de raisonnement, avec des techniques innovantes d'apprentissage par renforcement et plusieurs versions distillées pour une accessibilité plus large.

Réseaux sociaux et e-mail :

Visiter le site web

Promouvoir cet outil

https://chat.deepseek.com/coder?ref=aipure&utm_source=aipure

Aperçu
Analyses
Publications officielles
Vidéo
Articles
Alternatives

Informations sur le produit

Mis à jour:Jul 16, 2025

Tendances du trafic mensuel de DeepSeek-R1

DeepSeek-R1 a connu une baisse de 11,9% de son trafic, probablement en raison de défis réglementaires et de préoccupations liées à la confidentialité dans l'Union européenne, particulièrement concernant les transferts de données vers la Chine. Le Commissaire à la protection des données de Berlin a accusé DeepSeek d'avoir violé le RGPD, ce qui aurait pu dissuader les utilisateurs.

Voir l'historique du trafic

Qu'est-ce que DeepSeek-R1

DeepSeek-R1 est un modèle de raisonnement de première génération développé par DeepSeek AI qui se décline en deux variantes principales : DeepSeek-R1-Zero et DeepSeek-R1. Construit sur une architecture Mixture-of-Experts (MoE) avec 671B de paramètres au total et 37B de paramètres activés, il représente une avancée significative dans les capacités de raisonnement de l'IA. Le modèle est conçu pour gérer des tâches de raisonnement complexes grâce à des processus de chaîne de pensée et peut fonctionner avec une longueur de contexte de 128K tokens. Il est disponible à la fois via la plateforme de chat de DeepSeek et en tant que modèle open-source, avec plusieurs versions distillées allant de 1.5B à 70B de paramètres basées sur les architectures Llama et Qwen.

Caractéristiques principales de DeepSeek-R1

DeepSeek-R1 est un modèle de raisonnement AI avancé et open-source qui atteint des performances comparables à celles du modèle o1 d'OpenAI dans les tâches de mathématiques, de code et de raisonnement. Il a été entraîné en utilisant un apprentissage par renforcement à grande échelle et présente une architecture unique qui permet un raisonnement étape par étape, une auto-vérification et des capacités de réflexion. Le modèle a été distillé en versions plus petites basées sur Llama et Qwen, le rendant plus accessible tout en maintenant de fortes performances.

Capacités de Raisonnement Avancées: Utilise un raisonnement en chaîne de pensée avec des motifs d'auto-vérification et de réflexion, permettant une résolution de problèmes transparente étape par étape

Entraînement RL à Grande Échelle: Première recherche ouverte pour valider que les capacités de raisonnement peuvent être développées uniquement par l'apprentissage par renforcement sans ajustement supervisé

Options de Modèle Flexibles: Disponible en plusieurs tailles grâce à la distillation (1,5B à 70B paramètres), offrant des options pour différents besoins computationnels tout en maintenant de fortes performances

Longueur de Contexte Étendue: Prend en charge jusqu'à 128K tokens de longueur de contexte, permettant le traitement d'entrées plus longues et la génération de réponses plus détaillées

Cas d'utilisation de DeepSeek-R1

Résolution de Problèmes Mathématiques Avancés: Excelle dans la résolution de problèmes mathématiques complexes, y compris les benchmarks AIME et MATH-500, avec un raisonnement étape par étape

Développement Logiciel et Codage: Effectue des tâches de codage de haut niveau, des problèmes de programmation compétitive et des défis d'ingénierie logicielle avec une grande précision

Assistance Éducative: Aide les étudiants et les éducateurs en fournissant des explications détaillées et des approches de résolution de problèmes étape par étape dans divers sujets

Tâches de Raisonnement Multilingues: Gère des tâches de raisonnement complexes en anglais et en chinois, ce qui le rend précieux pour les applications internationales

Avantages

Open-source et utilisable commercialement sous la licence MIT

Performances comparables à celles des modèles propriétaires comme le o1 d'OpenAI

Disponible en plusieurs tailles pour différents besoins computationnels

Inconvénients

Nécessite des ressources computationnelles significatives pour les modèles plus grands

Le réglage de la température nécessite un ajustement minutieux pour éviter les répétitions

Les invites système ne sont pas prises en charge - toutes les instructions doivent être dans les invites de l'utilisateur

Comment utiliser DeepSeek-R1

Choisir la méthode d'accès: Vous avez trois options pour accéder à DeepSeek-R1 : Interface Web, API ou Installation Locale

Accès par Interface Web: Visitez chat.deepseek.com, connectez-vous et activez le bouton 'DeepThink' pour interagir avec DeepSeek-R1. Remarque : Limité à 50 messages par jour en mode avancé

Accès API: 1. Inscrivez-vous sur platform.deepseek.com pour obtenir une clé API 2. Utilisez l'API compatible OpenAI en spécifiant model='deepseek-reasoner' 3. Définissez base_url sur https://api.deepseek.com/v1

Installation Locale (Modèles Distillés): Installez vLLM ou SGLang pour exécuter des versions distillées plus petites localement. Pour vLLM, utilisez : 'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'

Configurer les paramètres d'utilisation: Définissez la température entre 0.5-0.7 (0.6 recommandé), évitez les invites système, incluez des instructions dans les invites utilisateur, et pour les problèmes mathématiques, ajoutez la directive '\boxed{}'

Sélectionner la version du modèle: Choisissez entre DeepSeek-R1-Zero (modèle RL pur), DeepSeek-R1 (modèle complet) ou versions distillées (basées sur Qwen/Llama) en fonction de vos ressources computationnelles

Formater les invites: Incluez toutes les instructions dans l'invite utilisateur sans invites système. Pour les problèmes mathématiques, demandez des réponses finales dans \boxed{}

Générer plusieurs réponses: Pour de meilleurs résultats, générez plusieurs réponses et faites la moyenne des résultats lors de l'évaluation des performances du modèle

FAQ de DeepSeek-R1

DeepSeek-R1 est un modèle de raisonnement de première génération développé par DeepSeek-AI qui atteint des performances comparables à OpenAI-o1 dans les tâches de mathématiques, de code et de raisonnement. Il est entraîné à l'aide d'un apprentissage par renforcement à grande échelle et comprend deux versions : DeepSeek-R1-Zero et DeepSeek-R1.

Publications officielles

Chargement...

Vidéo de DeepSeek-R1

Articles connexes

Comment Exécuter DeepSeek en Mode Hors Ligne Localement

DeepSeek-R1 vs. OpenAI O1 : Une comparaison complète des modèles d'IA open-source et propriétaires

Articles populaires

SweetAI Chat contre Secret Desires : Quel constructeur de partenaire IA vous convient le mieux ? | 2025

Jul 10, 2025

Comment Créer des Vidéos Virales d'Animaux IA en 2025 : Un Guide Étape par Étape

Jul 3, 2025

Meilleures alternatives à SweetAI Chat en 2025 : Comparaison des meilleures plateformes de petite amie IA et de chat NSFW

Jun 30, 2025

Comment créer des vidéos virales d'IA ASMR en 5 minutes (Pas de micro, pas de caméra nécessaire) | 2025

Jun 23, 2025

Analyses du site web de DeepSeek-R1

Trafic et classements de DeepSeek-R1

363.6M

Visites mensuelles

Classement mondial

Classement par catégorie

Tendances du trafic : Jan 2025-Jun 2025

Aperçu des utilisateurs de DeepSeek-R1

00:04:48

Durée moyenne de visite

3.02

Pages par visite

37.97%

Taux de rebond des utilisateurs

Principales régions de DeepSeek-R1

CN: 35.39%

RU: 7.94%

US: 5.65%

BR: 5.03%

IN: 2.96%

Others: 43.03%

Derniers outils d'IA similaires à DeepSeek-R1

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI est une plateforme polyvalente alimentée par IA offrant une assistance d'étude personnalisée, des solutions commerciales et du coaching de vie grâce à des fonctionnalités telles que l'analyse de documents, la génération de quiz, des cartes mémoire et des capacités de chat interactif.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI est une solution logicielle sur site qui fournit des outils complets de surveillance, de sécurité et d'optimisation pour les applications basées sur LLM avec des fonctionnalités telles que le suivi du comportement, la détection d'anomalies et l'optimisation des performances.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI est une plateforme alimentée par l'IA qui fournit des capacités de résumé en un clic pour divers types de contenu, y compris des articles de presse, des documents de recherche et des vidéos, tout en offrant également une orchestration avancée d'agents IA pour des tâches spécifiques au domaine.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS est une plateforme d'IA qui fournit un accès à plusieurs modèles de langage avancés comme Gemini, GPT-4, Claude et Grok avec une interface intuitive pour que les utilisateurs interagissent et comparent différents modèles d'IA.

Outils d'IA populaires comme DeepSeek-R1

ChatGPT

Large Language Models (LLMs)AI Chatbot

ChatGPT est un chatbot avancé alimenté par l'IA développé par OpenAI qui utilise le traitement du langage naturel pour engager des conversations semblables à celles des humains et aider dans un large éventail de tâches.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT est un prototype de recherche alimenté par l'IA d'OpenAI qui fournit des réponses rapides et conversationnelles avec des sources claires en utilisant des modèles GPT.

Gemini 2.5 Pro Preview 05-06

Free TrialLarge Language Models (LLMs)AI Chatbot

Gemini est la famille de modèles d'IA multimodaux la plus avancée et la plus capable de Google, capable de comprendre et de raisonner sans effort à travers le texte, les images, la vidéo, l'audio et le code pour alimenter diverses applications et services d'IA.

OpenAI

Free TrialLarge Language Models (LLMs)

OpenAI est une entreprise de recherche en intelligence artificielle de premier plan développant des modèles et des technologies d'IA avancés pour bénéficier à l'humanité.

Classement

Soumettre & PromouvoirNew