Stability AI发布SDXL 0.9以增强图像生成技术
2023年06月25日 由 daydream 发表
187625
0
总部位于伦敦的Stability AI发布了SDXL 0.9(Stable Diffusion XL),这是该公司包括Stable Diffusion在内的产品套件的最新成员。目前通过ClipDrop可以访问SDXL 0.9,即将推出API版本,并计划于7月中旬进行公开发布,此前已于4月进行了测试版发布。
SDXL 0.9能够在现代消费级GPU上运行,它可以为电影、电视、音乐和教学视频以及设计和工业应用领域生成超逼真的创作,使SDXL在实际AI图像实现领域处于领先位置。
SDXL系列涵盖了各种功能,不仅仅是基本的文本提示,还包括图像对图像提示(使用一张图像获取其变体),修复(重建图像中缺失的部分)和扩展(创建现有图像的无缝扩展)。
SDXL 0.9 拥有开源图像模型中最大的参数数量之一,包括35亿个参数基础模型(而31亿个参数)和66亿个参数模型集成管道。最终输出是通过两个模型运行输入并聚合结果来生成的。管道的第二阶段模型为第一阶段生成的输出引入了更精细的细节。它基于两个CLIP模型,包括迄今为止训练的最大的OpenCLIP模型之一(OpenCLIP-ViT-G/14),提供更高深度和1024×1024分辨率的图像。
今年三月,Stability AI收购了Clipdrop的创始公司Init ML。
新的SDXL 0.9可以在带有Windows 10或11或Linux操作系统的现代消费级gpu上运行,内存为16GB。此外,Nvidia GeForce RTX 20显卡(或同等更高标准)至少需要8GB VRAM。Linux用户也可以使用兼容16GB VRAM的AMD卡。
一系列新产品
SDXL 0.9将仅在有限的时间内用于研究目的,以收集反馈并在正式公开发布之前充分完善模型。运行其代码将公开发布在GitHub上。四月份,Stability AI推出了一个名为StableLM的软件包,其中包含了一组名为StableLM的开源大型语言模型。这些模型目前处于“alpha”阶段,可以在GitHub和Hugging Face上找到。
此外,Stability AI还发布了一个新的软件开发工具包(SDK),可与Stable Diffusion 2.0和Stable Diffusion XL配合使用,使用户可以通过调整各种参数(包括样式预设、速率、每秒帧数(FPS)、颜色、3D深度和后期处理效果)来控制软件的输出。
减轻版权侵权的威胁
早在一月份,艺术家们就对Stability AI提起集体诉讼,指控他们的艺术品被这些公司非法用于训练模特和创建新图像,危及他们的职业。Getty Images也以侵犯版权的罪名起诉了Stability AI。
在旧金山的彭博科技峰会上,Stability AI的首席执行官Emad Mostaque在一个公开采访中承认了人工智能生成的逼真深度伪造图像所带来的这些担忧。Mostaque透露,今年初公司确实拥有“逼真的模型”,但由于时间考虑选择没有发布。他强调需要加入水印等功能来建立标准,使AI生成内容能够进行跟踪和合理利用。
来源:https://analyticsindiamag.com/stability-ai-unveils-sdxl-0-9-to-enhance-image-generation/