MuseNet 是由 OpenAI 创建的深度神经网络,它能够生成 4 分钟的音符,使用了 10 种不同的乐器,并将风格从乡村到莫扎特到甲壳虫进行了组合。它所使用的相同通用无监督技术正是 GPT-2,这是一种大型变压器模型,训练用于预测序列中的下一个标记,无论是音频还是文本。该模型通过训练数据来自 MIDI 文件,并且能够通过从提示开始生成选定风格的样本。它使用了多种嵌入,如位置向量、时间向量和结构向量,以赋予模型更多的上下文。
全球排名
#26 4
国家/地区排名
82 2
行业排名
4
访问量
1.5B
跳出率
42.24%
每人访问页数
4.36
平均访问时长
00:04:22