Fish Speech Howto
Fish Speech est un modèle open-source de synthèse vocale multilingue capable de générer une parole de haute qualité et naturelle en chinois, japonais et anglais avec des voix et des émotions personnalisables.
Voir plusComment utiliser Fish Speech
Installer les dépendances: Installez les packages requis en exécutant : pip3 install torch torchvision torchaudio
Créer un environnement virtuel: Créez un environnement virtuel Python 3.10 en utilisant conda : conda create -n fish-speech python=3.10
Activer l'environnement: Activez l'environnement virtuel : conda activate fish-speech
Installer Fish Speech: Installez Fish Speech en exécutant : pip3 install -e .
Télécharger les modèles: Téléchargez les modèles requis depuis Hugging Face : huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
Exécuter l'inférence: Générez la parole en exécutant : python tools/llama/generate.py --text "Votre texte ici" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
Décoder l'audio: Décodez les tokens générés en audio en utilisant VQGAN : python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
Démarrer l'interface web (optionnel): Lancez l'interface web en exécutant : python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
FAQ de Fish Speech
Fish Speech est un modèle de synthèse vocale (TTS) open-source développé par Fish Audio. Il est entraîné sur 150 000 heures de données audio multilingues et peut générer une parole de haute qualité en chinois, japonais et anglais.
Articles populaires
Snap dévoile un outil de génération vidéo par IA pour les créateurs : Un changement de donne dans les médias sociaux
Sep 18, 2024
Gen 3 Alpha Video-to-Video de Runway : Une percée dans l'édition vidéo propulsée par l'IA lancée aujourd'hui
Sep 14, 2024
VideoMaker.me : Le Meilleur Générateur Gratuit de Vidéos de Câlins IA | Tutoriel d'Utilisation
Sep 13, 2024
OpenAI lance le modèle révolutionnaire GPT-o1 avec des capacités de raisonnement améliorées
Sep 13, 2024
Voir plus