Text2Video-Zero 模型卡片 - 控制网络 Canny 动漫风格

Text2Video-Zero 是一个零-shot 文本到视频生成器。它可以执行零-shot 文本到视频生成，视频指导 Pix2Pix（指导式视频编辑），文本和姿势条件视频生成，文本和Canny边缘条件视频生成，以及文本、Canny边缘和梦幻摄影机条件视频生成。有关此工作的更多信息，请查看我们的 paper 和我们的演示: 我们的 code 与任何 StableDiffusion 基础模型配合使用。

此模型提供了 Anime 风格的 DreamBooth 权重，用于文本到视频零编码中的边缘引导（使用 ControlNet ）。

Text2Video-Zero 权重

我们将原始权重转换为扩散器，并使其能够通过使用的边缘引导: https://github.com/lllyasviel/ControlNet/discussions/12 在 ControlNet 中使用。

模型详细信息

开发者: Levon Khachatryan, Andranik Movsisyan, Vahram Tadevosyan, Roberto Henschel, Zhangyang Wang, Shant Navasardyan 和 Humphrey Shi
模型类型: Dreambooth 文本到图像和文本到视频生成模型，带有边缘控制，适用于文本到视频零编码
语言：英文
许可证: The CreativeML OpenRAIL M license .
模型描述: 这是一个具有边缘引导和动漫风格的 text2video zero 模型。它也可以与 ControlNet 一起在带有边缘引导的文本到图像设置中使用。
重要关键字: 动漫风格
更多信息的资源: GitHub , Paper , CIVITAI .

引用如下:

@article{text2video-zero,
  title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
  author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
  journal={arXiv preprint arXiv:2303.13439},
  year={2023}
}

原始权重

Anime 风格的 Dreambooth 权重来自于 CIVITAI .

模型详细信息

开发者: Quiet_Joker（用户名列在 CIVITAI 上）
模型类型: Dreambooth 文本到图像生成模型
语言：英文
许可证: The CreativeML OpenRAIL M license .
模型描述: 这是一个使用 DreamBooth 创建的模型，它根据文本提示生成具有动漫风格的图像。
重要关键字: 动漫风格
更多信息的资源: CIVITAI .

偏见内容确认:

请注意，Text2Video-Zero 可能会输出强化或加剧社会偏见的内容，以及逼真的面孔、色情和暴力。这个演示中的 Text2Video-Zero 仅用于研究目的。

引用

  @article{text2video-zero,
    title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
    author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
    journal={arXiv preprint arXiv:2303.13439},
    year={2023}
  }

作者:

Picsart AI Research

数据集大小:

5.11 GB