稳定扩散(Stable Diffusion)是一个开源的 AI 模型,可以从文本中生成图像。Riffusion 调整了模型,使其能够创建称为频谱图(spectrogram)的图像,然后将这些图像转换为音频片段。频谱图就像是显示不同频率在不同时间听起来是什么样的图片。它们还开发了一个交互式网页应用程序,让任何人都可以输入提示以生成音频片段,然后应用程序将在不同的提示之间或相同提示的不同种子之间进行平滑过渡。
全球排名
#219,739 72,016
国家/地区排名
187,315 101,847
行业排名
4,058 2,020
访问量
199.1K
跳出率
41.12%
每人访问页数
3.85
平均访问时长
00:04:47