如何使用 Fish Speech
安装依赖: 通过运行以下命令安装所需包:pip3 install torch torchvision torchaudio
创建虚拟环境: 使用conda创建Python 3.10虚拟环境:conda create -n fish-speech python=3.10
激活环境: 激活虚拟环境:conda activate fish-speech
安装Fish Speech: 通过运行以下命令安装Fish Speech:pip3 install -e .
下载模型: 从Hugging Face下载所需模型:huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
运行推理: 通过运行以下命令生成语音:python tools/llama/generate.py --text "您的文本内容" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
解码音频: 使用VQGAN将生成的令牌解码为音频:python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
启动Web UI(可选): 通过运行以下命令启动Web界面:python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
Fish Speech 常见问题
Fish Speech是由Fish Audio开发的一个开源文本转语音(TTS)模型。它基于15万小时的多语言音频数据训练而成,能够生成高质量的中文、日文和英文语音。
Fish Speech 月度流量趋势
Fish Speech 在2月份的流量增长了40.9%,达到694K访问量。3月份Fish Speech 1.5的发布为全球用户提供了最真实的声音克隆功能,这可能通过提升用户参与度和吸引新用户促进了这一增长。
查看历史流量
查看更多