StyleDrop:比肩Midjourney的图像生成器

2023年06月05日 由 Samoyed 发表 374846 0
Google的StyleDrop一经发布便引起了广泛的关注。StyleDrop是一个由 Muse 提供支持的文本到图像生成器。StyleDrop可以按照特定的风格生成图像,它可以抓住用户提供的样式的细微差别和细节,例如配色方案、阴影、设计模式以及局部和全局效果。StyleDrop的工作原理是通过微调很少的可训练参数(少于总模型参数的1%)来有效地学习新风格,并通过人工或自动反馈的迭代训练来提高质量。更重要的是,即使用户只提供指定所需样式的单个图像,StyleDrop也能够提供令人满意的结果。根据研究表明,Muse上的Styledrop在根据文本生成并调整图像方面明显优于其他方法,包括Imagen或Stable Diffusion上的DreamBooth和Textual Inversion。

从单一图像生成风格化的图像

StyleDrop通过一个单一的参考图像生成任意风格的高质量图像。在训练和生成的过程中,自然语言中的风格描述符(例如,“在熔融的金色三维渲染风格中”)被附加到内容描述符中。

[caption id="attachment_52031" align="aligncenter" width="740"] 融化的金色3D渲染(melting golden 3d rendering)[/caption]

风格化的角色渲染

StyleDrop生成由单个参考图像描述的具有一致样式的字母图像。在训练和生成时,在内容描述符后面附加一个自然语言的风格描述符(例如,“在抽象的彩虹色流动烟波设计中”)。

[caption id="attachment_52032" align="alignnone" width="740"] 抽象彩虹色流动烟波设计(abstract rainbow colored flowing smoke wave design)[/caption]

成为你的风格助手

您可以很容易地使用自己的品牌资产训练StyleDrop,帮助您快速在自己的风格中设计您的想法。在训练和生成的过程中,自然语言中的风格描述符会附加到内容描述符中。



我的主题,我的风格

将StyleDrop和DreamBooth结合起来,以“我的风格”生成“我的主题”的图像。



与扩散模型微调的比较

Muse 上的 StyleDrop 是一种基于离散令牌的视觉转换器,在风格调整方面优于基于扩散(Imagen, Stable Diffusion)模型的现有方法。



 

来源:https://styledrop.github.io/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消