Stable Audio Open 常见问题

Question 1

什么是Stable Audio Open？

Accepted Answer

Stable Audio Open是由Stability AI开发的一个开源模型，用于通过文本提示生成最长47秒的音频样本、音效和制作元素。

Question 2

生成的音频片段最长可以有多长？

Accepted Answer

Stable Audio Open可以生成最长47秒的音频片段。

Question 3

它可以生成哪些类型的音频？

Accepted Answer

它旨在生成鼓点、乐器即兴片段、环境声音、拟音录音以及其他用于音乐制作和声音设计的音频样本。

Question 4

Stable Audio Open可以免费使用吗？

Accepted Answer

是的，Stable Audio Open是免费且开源的。模型权重可以在Hugging Face上下载。

Question 5

用户可以利用自己的数据对模型进行微调吗？

Accepted Answer

是的，用户可以使用自己的自定义音频数据对Stable Audio Open进行微调，以生成个性化的音效和音频样本。

Question 6

它与商业版的Stable Audio产品有何不同？

Accepted Answer

Stable Audio Open专注于最长47秒的短片段，而商业版的Stable Audio可以制作最长3分钟的完整曲目，并具备更高级的功能。

Question 7

用于训练模型的数据是什么？

Accepted Answer

该模型使用来自FreeSound和Free Music Archive的音频数据进行训练，尊重创作者权利。

Stable Audio Open 使用方法