模型:
google/ddpm-celebahq-256
Paper : Denoising Diffusion Probabilistic Models
Authors : Jonathan Ho, Ajay Jain, Pieter Abbeel
摘要 :
我们提出了使用扩散概率模型进行高质量图像合成的结果,这是一类受非平衡热力学考虑启发的潜变量模型。我们通过训练基于一种新颖的扩散概率模型和具有 Langevin 动力学的去噪分数匹配之间的连接设计的加权变分上界来获得最佳结果,我们的模型自然地支持一种渐进的有损解压缩方案,可被解释为自回归解码的推广。在无条件的 CIFAR10 数据集上,我们获得了 9.46 的 Inception 分数和 3.17 的最先进的 FID 分数。在 256x256 的 LSUN 数据集上,我们获得了与 ProgressiveGAN 类似的样本质量。
DDPM 模型可以使用离散的噪声调度程序,例如:
用于推理。请注意,尽管 ddpm 调度程序产生的质量最高,但它也需要最长的时间。如果您希望在质量和推理速度之间获得良好的平衡,您可能要考虑 ddim 或 pndm 调度程序。
请参阅以下代码:
# !pip install diffusers from diffusers import DDPMPipeline, DDIMPipeline, PNDMPipeline model_id = "google/ddpm-celebahq-256" # load model and scheduler ddpm = DDPMPipeline.from_pretrained(model_id) # you can replace DDPMPipeline with DDIMPipeline or PNDMPipeline for faster inference # run pipeline in inference (sample random noise and denoise) image = ddpm()["sample"] # save image image[0].save("ddpm_generated_image.png")
有关更详细的信息,请查看 official inference example
如果您想训练自己的模型,请查看 official training example