商汤发布可控人物视频生成大模型Vimi，实现分钟级视频

2024年07月05日由 daydream 发表 391 0

在近日于上海举办的2024年世界人工智能大会（WAIC）上，一款由商汤科技研发的可控人物视频生成大模型Vimi吸引了广泛关注。作为首个面向消费者（C端）用户的此类技术产品，Vimi凭借其独特的创新能力和实际应用潜力，在大会展览中脱颖而出，成为展示亮点之一。

1720070726240

Vimi依托于商汤科技的日日新大模型体系，通过深度学习和生成式AI技术，实现了从静态照片到动态视频的自然转换。与传统产品相比，Vimi在人物表情和肢体动作的精准控制上取得了显著突破。用户仅需提供一张任意风格的照片，Vimi便能生成与目标动作高度一致的视频，且支持多种驱动方式，包括已有人物视频、动画、声音及文字等，极大地丰富了视频创作的可能性。

值得注意的是，Vimi在视频生成过程中，能够自动匹配并生成与人物相符的头发、服饰及背景变化，同时保持光影效果的和谐统一，使得生成的视频流畅自然，视觉效果唯美。此外，Vimi还具备强大的稳定性，能够生成长达一分钟的单镜头人物视频，满足娱乐互动等长时间视频生成的需求。

Vimi的推出，不仅解决了当前市场上同类产品在表情控制、效果稳定性及视频时长等方面的不足，还进一步降低了视频创作的门槛，使其更加贴近广大消费者的实际需求。特别是针对女性用户群体，Vimi提供了丰富的娱乐创作功能，如聊天、唱歌、舞动等场景的视频生成，以及多样化的表情包创作，满足了用户对于个性化、趣味化视频内容的追求。

随着短视频和直播平台的兴起，以人物为主体的视频内容需求量急剧增长。Vimi的出现，为视频创作者提供了高效、便捷的创作工具，有助于提升内容生产效率和质量。同时，Vimi的开放使用，也意味着普通消费者也能轻松参与到视频创作的行列中来，享受科技带来的乐趣和便利。

目前，Vimi已在商汤科技官网开放预约，更多技术细节和应用场景将在后续活动中逐步揭晓。这一创新技术的问世，无疑将为人工智能在视频创作领域的应用开辟新的篇章。

文章来源：https://www.lieyunpro.com/archives/493614

标签：

商汤大模型 Vimi

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇生成式AI的“开放洗白”：人工智能公司如何伪装开放性

下一篇特斯拉二代人形机器人optimus亮相WAIC，行走速度提升30%

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来