Riffusion

稳定扩散(Stable Diffusion)是一个开源的 AI 模型,可以从文本中生成图像。Riffusion 调整了模型,使其能够创建称为频谱图(spectrogram)的图像,然后将这些图像转换为音频片段。频谱图就像是显示不同频率在不同时间听起来是什么样的图片。它们还开发了一个交互式网页应用程序,让任何人都可以输入提示以生成音频片段,然后应用程序将在不同的提示之间或相同提示的不同种子之间进行平滑过渡。

访问量: 199.1K
国家: United States
AI音乐创作 Open Source

评论

登录 After Sign In, you can make comments