模型:

PAIR/text2video-zero-controlnet-canny-gta5

英文

Text2Video-Zero 模型卡 - ControlNet Canny GTA-5 风格

Text2Video-Zero 是一个零样本文本到视频生成器。它可以执行零样本文本到视频生成、视频指令 Pix2Pix(指令引导的视频编辑)、文本和姿势条件视频生成、文本和 Canny 边缘条件视频生成,以及文本、Canny 边缘和梦境间隔条件视频生成。有关这项工作的更多信息,请参阅我们的 paper 和我们的演示: 。我们的 code 与任何 StableDiffusion 基模型兼容。

该模型为 GTA-5 风格的权重提供了边缘引导(使用 ControlNet )与 text2video zero 的结合使用。

Text2Video-Zero 的权重

我们将原始权重转换为扩散器,使其可以与 ControlNet 结合使用边缘引导来进行 text2video zero。

模型细节

  • 开发者:Levon Khachatryan,Andranik Movsisyan,Vahram Tadevosyan,Roberto Henschel,Zhangyang Wang,Shant Navasardyan 和 Humphrey Shi

  • 模型类型:Dreambooth 文本到图像和文本到视频生成模型,具有用于 text2video zero 的边缘控制

  • 语言:英语

  • 许可证: The CreativeML OpenRAIL M license

  • 模型说明:这是一个带有边缘引导和 GTA-5 风格的 text2video zero 模型。它还可以与 ControlNet 结合在文本到图像设置中使用边缘引导。

  • DreamBoth 关键字:gtav 风格

  • 更多信息的资源: GitHub Paper CIVITAI

  • 引用方式:

    @article{text2video-zero,
      title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
      author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
      journal={arXiv preprint arXiv:2303.13439},
      year={2023}
    }
    

原始权重

GTA-5 风格的 Dreambooth 权重来自 CIVITAI

模型细节

  • 开发者:Quiet_Joker(CIVITAI 上列出的用户名)
  • 模型类型:Dreambooth 文本到图像生成模型
  • 语言:英语
  • 许可证: The CreativeML OpenRAIL M license
  • 模型说明:这是一个使用 DreamBooth 创建的模型,根据文本提示以 GTA-5 风格生成图像。
  • DreamBoth 关键字:gtav 风格
  • 更多信息的资源: CIVITAI

偏见内容确认

请注意,Text2Video-Zero 可能会输出强化或加剧社会偏见的内容,以及逼真的人脸、色情和暴力内容。此演示中的 Text2Video-Zero 仅供研究目的使用。

引用

  @article{text2video-zero,
    title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
    author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
    journal={arXiv preprint arXiv:2303.13439},
    year={2023}
  }