Fish Speech 使用方法

Fish Speech 是一個開源的多語言文本轉語音模型,能夠在中文、日文和英文中生成高質量、自然語音,具有可定制的聲音和情感。
查看更多

如何使用 Fish Speech

安裝依賴: 通過運行以下命令安裝所需包:pip3 install torch torchvision torchaudio
創建虛擬環境: 使用 conda 創建 Python 3.10 虛擬環境:conda create -n fish-speech python=3.10
激活環境: 激活虛擬環境:conda activate fish-speech
安裝 Fish Speech: 通過運行以下命令安裝 Fish Speech:pip3 install -e .
下載模型: 從 Hugging Face 下載所需模型:huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
運行推理: 通過運行以下命令生成語音:python tools/llama/generate.py --text "您的文本在此" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
解碼音頻: 使用 VQGAN 將生成的令牌解碼為音頻:python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
啟動網頁界面(可選): 通過運行以下命令啟動網頁界面:python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"

Fish Speech 常見問題

Fish Speech 是由 Fish Audio 開發的開源文字轉語音(TTS)模型。它經過 150,000 小時的多語言音頻數據訓練,能夠在中文、日文和英文中生成高質量的語音。

Fish Speech 每月流量趨勢

Fish Speech 的流量下降了 8.1%,達到 493K 次訪問。由於沒有特定的產品更新,這種下降可能是由於更廣泛的市場波動和來自其他人工智能文字轉語音平台的競爭加劇所致。

查看歷史流量

与 Fish Speech 类似的最新 AI 工具

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai 是一個全方位的 AI 語音生成平台,將書面文字轉換為高質量、自然的語音,支持 17+ 種語言,提供超過 5000 個逼真的 AI 語音。
Narrai
Narrai
Narrai是一款AI驅動的移動應用程序,通過自動生成相關劇本並提供多種敘述者角色,即時為短視頻創建語音旁白和背景音樂。
Vagent
Vagent
Vagent 是一個輕量級的語音界面,使用戶能夠通過語音命令與自定義 AI 代理進行交互,提供了一種自然且直觀的方式來控制自動化,支持 60 多種語言。
F5 TTS
F5 TTS
F5-TTS 是一個最先進的非自回歸文本轉語音系統,使用 Flow Matching 和 Diffusion Transformer 技術生成高度自然和表達豐富的語音,具有零樣本語音克隆功能。