Fish Speech 使用方法

Fish Speech 是一款开源的多语言文本转语音模型,能够在中文、日文和英文中生成高质量、自然语音,并支持可定制的声音和情感。
查看更多

如何使用 Fish Speech

安装依赖: 通过运行以下命令安装所需包:pip3 install torch torchvision torchaudio
创建虚拟环境: 使用conda创建Python 3.10虚拟环境:conda create -n fish-speech python=3.10
激活环境: 激活虚拟环境:conda activate fish-speech
安装Fish Speech: 通过运行以下命令安装Fish Speech:pip3 install -e .
下载模型: 从Hugging Face下载所需模型:huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
运行推理: 通过运行以下命令生成语音:python tools/llama/generate.py --text "您的文本内容" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
解码音频: 使用VQGAN将生成的令牌解码为音频:python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
启动Web UI(可选): 通过运行以下命令启动Web界面:python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"

Fish Speech 常见问题

Fish Speech是由Fish Audio开发的一个开源文本转语音(TTS)模型。它基于15万小时的多语言音频数据训练而成,能够生成高质量的中文、日文和英文语音。

Fish Speech 月度流量趋势

Fish Speech 流量下降了 8.1%,访问量达到 493K。由于没有特定的产品更新,这种下降可能归因于更广泛的市场波动以及来自其他人工智能文本转语音平台的竞争加剧。

查看历史流量

与 Fish Speech 类似的最新 AI 工具

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai是一个全方位的AI语音生成平台,将书面文本转换为高质量、自然的语音,支持17多种语言,提供超过5000种逼真的AI语音。
Narrai
Narrai
Narrai是一款AI驱动的移动应用,通过自动生成相关剧本并提供多种叙述者角色,即时为短视频创建语音旁白和背景音乐。
Vagent
Vagent
Vagent是一个轻量级的语音接口,使用户可以通过语音命令与自定义AI代理互动,提供了一种自然和直观的方式来控制自动化,支持60多种语言。
F5 TTS
F5 TTS
F5-TTS 是一种最先进的非自回归文本转语音系统,使用 Flow Matching 和 Diffusion Transformer 技术生成高度自然和富有表现力的语音,具有零样本语音克隆功能。