Fish Speech Howto

Fish Speech adalah model text-to-speech open-source multibahasa yang mampu menghasilkan suara berkualitas tinggi yang terdengar alami dalam bahasa Mandarin, Jepang, dan Inggris dengan suara dan emosi yang dapat disesuaikan.
Lihat Lebih Banyak

Cara Menggunakan Fish Speech

Instal dependensi: Instal paket yang diperlukan dengan menjalankan: pip3 install torch torchvision torchaudio
Buat lingkungan virtual: Buat lingkungan virtual Python 3.10 menggunakan conda: conda create -n fish-speech python=3.10
Aktifkan lingkungan: Aktifkan lingkungan virtual: conda activate fish-speech
Instal Fish Speech: Instal Fish Speech dengan menjalankan: pip3 install -e .
Unduh model: Unduh model yang diperlukan dari Hugging Face: huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
Jalankan inferensi: Hasilkan suara dengan menjalankan: python tools/llama/generate.py --text "Teks Anda di sini" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
Dekode audio: Dekode token yang dihasilkan menjadi audio menggunakan VQGAN: python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
Mulai UI web (opsional): Luncurkan antarmuka web dengan menjalankan: python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"

FAQ Fish Speech

Fish Speech adalah model teks-ke-suara (TTS) sumber terbuka yang dikembangkan oleh Fish Audio. Ini dilatih pada 150.000 jam data audio multibahasa dan dapat menghasilkan suara berkualitas tinggi dalam bahasa Mandarin, Jepang, dan Inggris.

Tren Traffic Bulanan Fish Speech

Fish Speech mencapai peningkatan sebesar 40,9% dalam jumlah kunjungan menjadi 694 ribu kunjungan pada bulan Februari. Peluncuran Fish Speech 1.5 pada bulan Maret, yang menawarkan kloning suara paling realistis untuk pengguna global, kemungkinan berkontribusi pada pertumbuhan ini dengan meningkatkan keterlibatan pengguna dan menarik pengguna baru.

Lihat riwayat traffic

Alat AI Terbaru Serupa dengan Fish Speech

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai adalah platform generator suara AI serba ada yang mengubah teks tertulis menjadi suara berkualitas tinggi yang terdengar alami dengan lebih dari 5000 suara AI realistis yang mendukung lebih dari 17 bahasa.
Narrai
Narrai
Narrai adalah aplikasi mobile bertenaga AI yang secara instan membuat narasi suara dan musik latar untuk video pendek dengan secara otomatis menghasilkan skrip yang relevan dan menawarkan beberapa persona narator.
Vagent
Vagent
Vagent adalah antarmuka suara ringan yang memungkinkan pengguna berinteraksi dengan agen AI kustom melalui perintah suara, memberikan cara yang alami dan intuitif untuk mengontrol otomatisasi dengan dukungan untuk 60+ bahasa.
F5 TTS
F5 TTS
F5-TTS adalah sistem teks-ke-suara canggih yang non-autoregressive yang menggunakan teknik Flow Matching dan Diffusion Transformer untuk menghasilkan suara yang sangat alami dan ekspresif dengan kemampuan kloning suara nol tembakan.