阿里巴巴通过Make-A-Character让AI形象赋予生命

2023年12月28日由 camellia 发表 809 0

阿里巴巴的Make-A-Character (Mach) 轻松地将文本描述转化为个性化的视觉化形象，为用户提供一个便捷的工具来创建与其想要的角色相符的虚拟形象。

为了降低创建3D数字人物的门槛，阿里巴巴的研究人员最近推出了一种文本到3D模型的转换工具，名为Make-A-Character（又称Mach）。这款新工具利用大型语言和视觉基础模型，从简单的文本描述或自然语言中生成详细逼真的3D形象。

研究人员表示，当前版本重点生成视觉上吸引人的亚洲种族3D形象，因为其选定的SD模型主要是在亚洲面部图像上训练的。他们期望在未来几个月内扩展对不同种族和风格的支持。

此外，研究人员表示，它的去光照数据集仅包含干净的面部纹理。生成的形象可能会减弱非自然的面部图案，如涂鸦或贴纸。“目前，我们的服装和身体部分是预制的，基于文本相似性进行匹配。然而，我们正在积极开发由文本提示驱动的服装、表情和动作生成技术，”研究人员分享说。

它是如何工作的？

阿里巴巴的Mach无缝地将文本描述符转换为视觉形象，为用户提供了一种简单的方法来创建与他们预期角色一致的定制形象。

它的工作方式是，这些语义属性（提示）然后被映射到相应的视觉线索，进一步指导使用Stable Diffusion和ControlNet生成参考肖像图像。

完成这一步骤后，通过一系列的2D面部解析和3D生成模块，目标面部的网格和纹理被生成并组装，同时添加匹配的附件。之后，参数化的表现形式使生成的3D形象易于动画化。

其他AI模型

就在几天前，阿里巴巴还通过推出Richdreamer——一个正常深度扩散模型——解决了从2D到3D生成的挑战。此外，阿里巴巴还引入了“Animate Anyone”——一种先进的角色动画技术，使用扩散模型将静态图像转换为动态角色视频。

在这股势头的推动下，阿里巴巴最近推出了Qwen-72B，一种参数更多、定制性更强的语言模型，紧随10月推出的Qwen-7B之后。此外，它还向研究社区赠送了一个较小的语言模型，Qwen-1.8B，具有2K上下文长度和只需3GB GPU内存的适中需求。

文章来源：https://analyticsindiamag.com/alibaba-makes-ai-agents-come-to-life-with-make-a-character/

标签：

人工智能阿里巴巴 Make-A-Character

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Altman与Ive联手：OpenAI与苹果在AI领域的竞争

下一篇提示工程：让GPT模型实现更优响应

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

OpenAI旗下AI对话工具

在线设计工具Canva推出的AI设计工具

科大讯飞推出的AI转语音和配音工具

阿里最新推出的AI绘画创作模型

WPS免费开放的AI办公助手

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市