在近日于上海举办的2024年世界人工智能大会(WAIC)上,一款由商汤科技研发的可控人物视频生成大模型Vimi吸引了广泛关注。作为首个面向消费者(C端)用户的此类技术产品,Vimi凭借其独特的创新能力和实际应用潜力,在大会展览中脱颖而出,成为展示亮点之一。
Vimi依托于商汤科技的日日新大模型体系,通过深度学习和生成式AI技术,实现了从静态照片到动态视频的自然转换。与传统产品相比,Vimi在人物表情和肢体动作的精准控制上取得了显著突破。用户仅需提供一张任意风格的照片,Vimi便能生成与目标动作高度一致的视频,且支持多种驱动方式,包括已有人物视频、动画、声音及文字等,极大地丰富了视频创作的可能性。
值得注意的是,Vimi在视频生成过程中,能够自动匹配并生成与人物相符的头发、服饰及背景变化,同时保持光影效果的和谐统一,使得生成的视频流畅自然,视觉效果唯美。此外,Vimi还具备强大的稳定性,能够生成长达一分钟的单镜头人物视频,满足娱乐互动等长时间视频生成的需求。
Vimi的推出,不仅解决了当前市场上同类产品在表情控制、效果稳定性及视频时长等方面的不足,还进一步降低了视频创作的门槛,使其更加贴近广大消费者的实际需求。特别是针对女性用户群体,Vimi提供了丰富的娱乐创作功能,如聊天、唱歌、舞动等场景的视频生成,以及多样化的表情包创作,满足了用户对于个性化、趣味化视频内容的追求。
随着短视频和直播平台的兴起,以人物为主体的视频内容需求量急剧增长。Vimi的出现,为视频创作者提供了高效、便捷的创作工具,有助于提升内容生产效率和质量。同时,Vimi的开放使用,也意味着普通消费者也能轻松参与到视频创作的行列中来,享受科技带来的乐趣和便利。
目前,Vimi已在商汤科技官网开放预约,更多技术细节和应用场景将在后续活动中逐步揭晓。这一创新技术的问世,无疑将为人工智能在视频创作领域的应用开辟新的篇章。