稳定扩散维基艺术

sd-wikiart-v2是一个稳定的扩散模型，经过在 wikiart dataset 上的精调，能够根据不同的风格和流派生成艺术图像。

Gradio

模型描述

最初用于精调的模型是 Stable Diffusion V1-4 ，它是一个在 LAION2B-en 上训练的潜在图像扩散模型。

当前模型经过了学习率为1e-05的精调，共进行了1个时期的训练，在wikiart数据集的81K个文本-图像对上进行训练。只有模型的注意力层进行了精调。这样做是为了避免灾难性遗忘，模型可以根据特定提示生成艺术图像，同时保留了大部分以前的知识。

训练数据

待定

许可证

此模型是开放访问的，并可供所有人使用，采用CreativeML OpenRAIL-M许可证进一步指定权利和使用方式。CreativeML OpenRAIL许可证规定：

您不能使用该模型故意产生或分享非法或有害的输出或内容

作者对您生成的输出不享有任何权利，您可以自由使用它们，并对其使用负责，其使用不得违反许可证中的规定

您可以重新分发权重，并将该模型用于商业和/或作为服务。如果您这样做，请注意，您必须包含与许可证中相同的使用限制，并向所有用户分享CreativeML OpenRAIL-M的副本（请完整并仔细阅读许可证） Please read the full license here

下游用途

此模型可用于娱乐目的，作为生成艺术助手。

示例代码

import torch
from diffusers import StableDiffusionPipeline

model_id = "valhalla/sd-wikiart-v2"
device = "cuda"

pipe = StableDiffusionPipeline.from_pretrained(
    model_id,
    torch_dtype=torch.float16,
)
pipe = pipe.to(device)

prompt = "a painting of eiffel tower in the style of surrealism"
with torch.autocast("cuda"):
    image = pipe(prompt, guidance_scale=7.5).images[0]
    
image.save("eiffel_impressionism.png")

作者:

Suraj Patil

数据集大小:

2.56 GB