FAQ de Collaborative Language Model Runner

Question 1

Qu'est-ce que Petals ?

Accepted Answer

Petals est un système open-source qui permet aux utilisateurs d'exécuter des modèles de langage de grande taille (plus de 100 milliards de paramètres) de manière collaborative et distribuée, similaire à BitTorrent. Il permet d'exécuter des modèles comme BLOOM-176B pour l'inférence et le fine-tuning en faisant charger aux utilisateurs de petites parties du modèle et en s'associant à d'autres.

Question 2

Comment fonctionne Petals ?

Accepted Answer

Petals fonctionne en divisant les grands modèles de langage entre plusieurs utilisateurs. Chaque utilisateur charge une petite partie du modèle, puis collabore avec d'autres qui servent les parties restantes pour exécuter l'inférence ou le fine-tuning. Cette approche distribuée permet d'exécuter des modèles massifs sur du matériel grand public.

Question 3

Quels sont les avantages d'utiliser Petals ?

Accepted Answer

Petals offre plusieurs avantages : 1) Il permet d'exécuter d'énormes modèles de langage sur du matériel grand public. 2) Il est jusqu'à 10 fois plus rapide que le déchargement pour le fine-tuning et l'inférence. 3) Il offre plus de flexibilité que les API typiques, permettant un fine-tuning personnalisé, des méthodes d'échantillonnage et l'accès aux états cachés. 4) Il est open-source et dirigé par la communauté.

Question 4

Petals est-il gratuit à utiliser ?

Accepted Answer

Oui, Petals est gratuit et open-source. Cependant, les utilisateurs sont encouragés à contribuer leurs ressources GPU au réseau pour aider à exécuter les modèles distribués.

Question 5

Quels modèles peuvent être exécutés sur Petals ?

Accepted Answer

Petals prend en charge l'exécution de grands modèles de langage comme BLOOM-176B, Llama 3.1 (jusqu'à 405 milliards), Mixtral (8x22 milliards) et Falcon (plus de 40 milliards). Les modèles disponibles peuvent être vérifiés sur le tableau de bord de santé de Petals.

Question 6

Est-il sûr d'utiliser Petals pour des données sensibles ?

Accepted Answer

Non, il n'est pas recommandé d'utiliser le nuage public de Petals pour des données sensibles. Le nuage public est conçu uniquement pour la recherche et l'utilisation académique. Pour des données sensibles, les utilisateurs peuvent configurer un nuage privé entre des parties de confiance.

Collaborative Language Model Runner Howto

Plus d'informations

Comment utiliser Collaborative Language Model Runner