Stable Audio Open 常見問題

Question 1

什麼是 Stable Audio Open？

Accepted Answer

Stable Audio Open 是由 Stability AI 開發的開源模型，用於根據文字提示生成長達 47 秒的音頻樣本、音效和製作元素。

Question 2

生成的音頻片段可以有多長？

Accepted Answer

Stable Audio Open 可以生成長達 47 秒的音頻片段。

Question 3

它可以生成哪些類型的音頻？

Accepted Answer

它旨在生成鼓點、樂器即興片段、環境聲音、擬音錄音和其他用於音樂製作和聲音設計的音頻樣本。

Question 4

Stable Audio Open 可以免費使用嗎？

Accepted Answer

是的，Stable Audio Open 是免費且開源的。模型權重可在 Hugging Face 上下載。

Question 5

用戶可以通過自己的數據對模型進行微調嗎？

Accepted Answer

是的，用戶可以使用自己的自定義音頻數據對 Stable Audio Open 進行微調，以生成個性化的音效和音頻樣本。

Question 6

它與商業版的 Stable Audio 產品有何不同？

Accepted Answer

Stable Audio Open 專注於長達 47 秒的較短片段，而商業版的 Stable Audio 可以製作長達 3 分鐘的完整曲目，並具有更多高級功能。

Question 7

用於訓練模型的數據是什麼？

Accepted Answer

該模型使用來自 FreeSound 和 Free Music Archive 的音頻數據進行訓練，尊重創作者權利。

Stable Audio Open 使用方法