阿里巴巴通过Make-A-Character让AI形象赋予生命

2023年12月28日 由 camellia 发表 562 0

阿里巴巴的Make-A-Character (Mach) 轻松地将文本描述转化为个性化的视觉化形象,为用户提供一个便捷的工具来创建与其想要的角色相符的虚拟形象。


2


为了降低创建3D数字人物的门槛,阿里巴巴的研究人员最近推出了一种文本到3D模型的转换工具,名为Make-A-Character(又称Mach)。这款新工具利用大型语言和视觉基础模型,从简单的文本描述或自然语言中生成详细逼真的3D形象。


研究人员表示,当前版本重点生成视觉上吸引人的亚洲种族3D形象,因为其选定的SD模型主要是在亚洲面部图像上训练的。他们期望在未来几个月内扩展对不同种族和风格的支持。


此外,研究人员表示,它的去光照数据集仅包含干净的面部纹理。生成的形象可能会减弱非自然的面部图案,如涂鸦或贴纸。“目前,我们的服装和身体部分是预制的,基于文本相似性进行匹配。然而,我们正在积极开发由文本提示驱动的服装、表情和动作生成技术,”研究人员分享说。


它是如何工作的?


阿里巴巴的Mach无缝地将文本描述符转换为视觉形象,为用户提供了一种简单的方法来创建与他们预期角色一致的定制形象。


它的工作方式是,这些语义属性(提示)然后被映射到相应的视觉线索,进一步指导使用Stable Diffusion和ControlNet生成参考肖像图像。


完成这一步骤后,通过一系列的2D面部解析和3D生成模块,目标面部的网格和纹理被生成并组装,同时添加匹配的附件。之后,参数化的表现形式使生成的3D形象易于动画化。


其他AI模型


就在几天前,阿里巴巴还通过推出Richdreamer——一个正常深度扩散模型——解决了从2D到3D生成的挑战。此外,阿里巴巴还引入了“Animate Anyone”——一种先进的角色动画技术,使用扩散模型将静态图像转换为动态角色视频。


在这股势头的推动下,阿里巴巴最近推出了Qwen-72B,一种参数更多、定制性更强的语言模型,紧随10月推出的Qwen-7B之后。此外,它还向研究社区赠送了一个较小的语言模型,Qwen-1.8B,具有2K上下文长度和只需3GB GPU内存的适中需求。

文章来源:https://analyticsindiamag.com/alibaba-makes-ai-agents-come-to-life-with-make-a-character/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消