Fish Speech Howto
Fish Speech adalah model text-to-speech open-source multibahasa yang mampu menghasilkan suara berkualitas tinggi yang terdengar alami dalam bahasa Mandarin, Jepang, dan Inggris dengan suara dan emosi yang dapat disesuaikan.
Lihat Lebih BanyakCara Menggunakan Fish Speech
Instal dependensi: Instal paket yang diperlukan dengan menjalankan: pip3 install torch torchvision torchaudio
Buat lingkungan virtual: Buat lingkungan virtual Python 3.10 menggunakan conda: conda create -n fish-speech python=3.10
Aktifkan lingkungan: Aktifkan lingkungan virtual: conda activate fish-speech
Instal Fish Speech: Instal Fish Speech dengan menjalankan: pip3 install -e .
Unduh model: Unduh model yang diperlukan dari Hugging Face: huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
Jalankan inferensi: Hasilkan suara dengan menjalankan: python tools/llama/generate.py --text "Teks Anda di sini" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
Dekode audio: Dekode token yang dihasilkan menjadi audio menggunakan VQGAN: python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
Mulai UI web (opsional): Luncurkan antarmuka web dengan menjalankan: python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
FAQ Fish Speech
Fish Speech adalah model teks-ke-suara (TTS) sumber terbuka yang dikembangkan oleh Fish Audio. Ini dilatih pada 150.000 jam data audio multibahasa dan dapat menghasilkan suara berkualitas tinggi dalam bahasa Mandarin, Jepang, dan Inggris.
Tren Traffic Bulanan Fish Speech
Fish Speech mengalami peningkatan sebesar 40,9% dalam jumlah kunjungan, mencapai 694 ribu. Peluncuran Fish Speech 1.5 pada bulan Maret, yang menawarkan kloning suara paling realistis untuk pengguna global, kemungkinan berkontribusi pada pertumbuhan ini. Selain itu, dukungan lintas bahasa dalam 13 bahasa dan fitur Deteksi Aktivitas Suara platform ini mungkin telah memperluas basis penggunanya dan meningkatkan keterlibatan pengguna.
Lihat riwayat traffic
Artikel Populer

Ulasan DeepAgent 2025: Agen AI Tingkat Dewa yang Viral di Mana-Mana
Apr 27, 2025

Tutorial Video Berpelukan PixVerse V2.5 | Cara Membuat Video Berpelukan AI di Tahun 2025
Apr 22, 2025

Rilis PixVerse V2.5: Ciptakan Video AI Tanpa Cela Tanpa Lag atau Distorsi!
Apr 21, 2025

MiniMax Video-01(Hailuo AI): Lompatan Revolusioner AI dalam Pembuatan Teks-ke-Video 2025
Apr 21, 2025
Lihat Selengkapnya