Fish Speech Howto

Fish Speech adalah model text-to-speech open-source multibahasa yang mampu menghasilkan suara berkualitas tinggi yang terdengar alami dalam bahasa Mandarin, Jepang, dan Inggris dengan suara dan emosi yang dapat disesuaikan.
Lihat Lebih Banyak

Cara Menggunakan Fish Speech

Instal dependensi: Instal paket yang diperlukan dengan menjalankan: pip3 install torch torchvision torchaudio
Buat lingkungan virtual: Buat lingkungan virtual Python 3.10 menggunakan conda: conda create -n fish-speech python=3.10
Aktifkan lingkungan: Aktifkan lingkungan virtual: conda activate fish-speech
Instal Fish Speech: Instal Fish Speech dengan menjalankan: pip3 install -e .
Unduh model: Unduh model yang diperlukan dari Hugging Face: huggingface-cli download fishaudio/fish-speech-1.2-sft --local-dir checkpoints/fish-speech-1.2-sft
Jalankan inferensi: Hasilkan suara dengan menjalankan: python tools/llama/generate.py --text "Teks Anda di sini" --checkpoint-path "checkpoints/fish-speech-1.2-sft"
Dekode audio: Dekode token yang dihasilkan menjadi audio menggunakan VQGAN: python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"
Mulai UI web (opsional): Luncurkan antarmuka web dengan menjalankan: python -m tools.webui --llama-checkpoint-path "checkpoints/fish-speech-1.2-sft" --decoder-checkpoint-path "checkpoints/fish-speech-1.2-sft/firefly-gan-vq-fsq-4x1024-42hz-generator.pth"

FAQ Fish Speech

Fish Speech adalah model teks-ke-suara (TTS) sumber terbuka yang dikembangkan oleh Fish Audio. Ini dilatih pada 150.000 jam data audio multibahasa dan dapat menghasilkan suara berkualitas tinggi dalam bahasa Mandarin, Jepang, dan Inggris.

Alat AI Terbaru Serupa dengan Fish Speech

Voisi
Voisi
Voisi adalah toolkit bahasa bertenaga AI yang komprehensif yang memungkinkan pengguna untuk membuat percakapan, narasi, terjemahan, dan lebih banyak lagi menggunakan ratusan suara dalam berbagai bahasa.
Podcraftr
Podcraftr
Podcraftr adalah platform bertenaga AI yang secara otomatis mengubah konten teks menjadi podcast berkualitas studio dengan kemampuan monetisasi dan distribusi.
TextPixie AI Translator
TextPixie AI Translator
TextPixie AI Translator adalah alat online gratis yang secara instan menerjemahkan teks, gambar, dan audio di lebih dari 100 bahasa dengan akurasi tinggi menggunakan algoritma AI canggih.
Dubbing, Inc.
Dubbing, Inc.
Dubbing, Inc. adalah platform dubbing video yang didukung AI yang memungkinkan pengguna untuk menerjemahkan dan melokalisasi konten video ke dalam beberapa bahasa dengan cepat dan terjangkau.

Alat AI Populer Seperti Fish Speech

ElevenLabs
ElevenLabs
ElevenLabs adalah perusahaan penelitian dan penerapan audio AI yang menawarkan kemampuan teks-ke-suara, kloning suara, dan pengalihan suara yang canggih di 32 bahasa dengan lebih dari 100 suara AI yang realistis.
Vidnoz
Vidnoz
Vidnoz adalah platform pembuatan video bertenaga AI yang memungkinkan pengguna untuk dengan cepat menghasilkan video berkualitas profesional dengan avatar yang realistis, suara alami, dan template yang dapat disesuaikan.
Clipchamp
Clipchamp
Clipchamp adalah editor video online yang mudah digunakan dengan fitur profesional, alat bertenaga AI, dan template yang memungkinkan siapa saja untuk membuat video berkualitas tinggi tanpa keahlian.
Speechify
Speechify
Speechify adalah aplikasi teks-ke-suara AI terkemuka yang mengubah teks tertulis menjadi audio yang terdengar alami di berbagai platform dan perangkat.