模型:
google/ddpm-bedroom-256
论文: Denoising Diffusion Probabilistic Models
作者:Jonathan Ho, Ajay Jain, Pieter Abbeel
摘要:
我们使用扩散概率模型在图像合成方面取得了高质量的结果,这是一类受非平衡热力学考虑启发的潜变量模型。我们通过训练基于加权变分界的模型取得了最佳结果,该界设计考虑了扩散概率模型与Langevin动力学噪声打分匹配之间的新颖联系,而且我们的模型自然地采用了一个渐进的有损解压缩方案,可以解释为自回归解码的泛化。在无条件的CIFAR10数据集上,我们获得了9.46的Inception分数和3.17的最先进的FID分数。在256x256的LSUN数据集上,我们获得了与ProgressiveGAN相似的样本质量。
DDPM模型可以使用以下离散噪声调度器:
进行推理。请注意,虽然ddpm调度器提供了最高的质量,但它也需要最长的时间。为了在质量和推理速度之间取得良好的平衡,您可能需要考虑使用ddim或pndm调度器。
请查看以下代码:
# !pip install diffusers from diffusers import DDPMPipeline, DDIMPipeline, PNDMPipeline model_id = "google/ddpm-bedroom-256" # load model and scheduler ddpm = DDPMPipeline.from_pretrained(model_id) # you can replace DDPMPipeline with DDIMPipeline or PNDMPipeline for faster inference # run pipeline in inference (sample random noise and denoise) image = ddpm().images[0] # save image image.save("ddpm_generated_image.png")
有关更详细的信息,请查看 official inference example
如果您想训练自己的模型,请查看 official training example