数据集:

teticio/audio-diffusion-instrumental-hiphop-256

英文

256x256的音频样本对应的mel频谱图,每个样本为5秒的无伴奏嘻哈音乐。代码用于音频到频谱图的转换以及频谱图到音频的转换可以在< a href=" https://github.com/teticio/audio-diffusion ">此处找到,还有用于训练和运行去噪扩散概率模型的脚本。

x_res = 256
y_res = 256
sample_rate = 22050
n_fft = 2048
hop_length = 512