数据集:
teticio/audio-diffusion-instrumental-hiphop-256
256x256的音频样本对应的mel频谱图,每个样本为5秒的无伴奏嘻哈音乐。代码用于音频到频谱图的转换以及频谱图到音频的转换可以在< a href=" https://github.com/teticio/audio-diffusion ">此处找到,还有用于训练和运行去噪扩散概率模型的脚本。
x_res = 256 y_res = 256 sample_rate = 22050 n_fft = 2048 hop_length = 512