如何使用 Stable Audio Open
下載模型: 從 Hugging Face 克隆模型倉庫:git clone https://huggingface.co/stabilityai/stable-audio-open-1.0
安裝依賴: 使用 pip 安裝所需庫:pip install torch torchaudio stable_audio_tools einops
導入庫: 導入必要的 Python 庫,包括 torch、torchaudio、stable_audio_tools 和 einops
加載模型: 使用以下命令加載預訓練模型:model, model_config = get_pretrained_model('stabilityai/stable-audio-open-1.0')
生成音頻: 使用 generate_diffusion_cond 函數根據文本提示生成音頻
處理輸出: 重新排列輸出音頻批次並進行標準化/轉換為所需格式
保存音頻: 使用 torchaudio.save() 將生成的音頻保存到文件
Stable Audio Open 常見問題
Stable Audio Open 是由 Stability AI 開發的開源模型,用於根據文字提示生成長達 47 秒的音頻樣本、音效和製作元素。
查看更多