国产纯自研视频大模型Vidu全球震撼发布

2024年07月31日由 neo 发表 671 0

昨日，国内领先的AI视频技术提供商——生数科技，正式宣布其自主研发的纯国产视频大模型Vidu（访问官网www.vidu.studio）在全球范围内正式上线。此次发布标志着视频创作领域迈入了一个全新的智能化时代，Vidu以其独特的文生视频与图生视频两大核心功能，为全球创作者提供了前所未有的创作体验。

Vidu大模型特别推出了4秒与8秒两种视频时长选项，满足用户多样化的创作需求，且最高支持1080P分辨率，确保每一帧画面都清晰细腻。更令人振奋的是，用户仅需30秒即可生成一段高质量的4秒视频片段，极大地提升了创作效率。为了让更多用户能够轻松上手，生数科技同步推出了Vidu免费版与标准版。免费版用户即可享受4秒视频生成、超清画质及一个并行任务的处理能力；而标准版则进一步解锁了8秒视频生成、商用授权、超清无水印输出及两个并行任务等高级功能，每月仅需7.99美元，性价比极高。

860

Vidu在风格多样性上同样实现了重大突破。相较于市面上大多局限于写实风格的AI视频工具，Vidu不仅完美覆盖写实、抽象等多种风格，还创新性地引入了动漫风格选项。这一功能不仅确保了动漫风格的高度一致性，还通过优化算法，有效避免了传统视频生成工具在“动漫化”过程中常见的画面抖动与风格突变问题，为动漫爱好者及创作者带来了更加流畅、稳定的视觉享受。此外，无论是科幻、西部、浪漫还是动画题材，Vidu都能精准捕捉并生成符合电影级标准的画面片段，让每一部作品都充满质感与想象力。

885

在“图生视频”领域，Vidu同样展现出了强大的创新能力。其独有的角色一致性功能，允许用户上传人像或自定义角色图，并通过简单的文字描述，即可让角色在任意场景中自由活动，完成各种动作。这一功能不仅简化了视频制作的复杂流程，节省了角色设计与调整的时间成本，更为创作者提供了无限的创意空间，让视频创作变得更加自由与灵活。

值得一提的是，Vidu还具备强大的文字理解与生成能力，能够精准识别并呈现提示词中的字母、数字等元素，并生成相应的文字特效。对于第一人称视角、延时摄影等高级镜头语言，Vidu同样能够游刃有余地表达，用户只需通过细致入微的提示词，即可实现对视频内容的精准控制，让创作更加随心所欲。

861

生数科技自2023年3月成立以来，便汇聚了来自清华大学人工智能研究院的顶尖人才，其核心团队在贝叶斯机器学习与多模态大模型领域积累了深厚的经验与技术储备。公司首席科学家、清华大学教授朱军表示：“Vidu的快速崛起，得益于团队在技术创新上的不懈追求与长期积累。特别是我们自主研发的U-ViT架构，作为全球首个将Diffusion与Transformer融合的架构，为Vidu提供了强大的技术支撑与无限可能。”

随着Vidu大模型的全球上线，生数科技正引领着视频创作领域的一场深刻变革。未来，生数科技将继续深耕AI视频技术，为全球创作者带来更多惊喜与可能，共同开启视频创作的新篇章。

文章来源：https://www.thepaper.cn/newsDetail_forward_28246695

标签：

人工智能 AI视频

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Getty图像生成器AI技术获升级

下一篇 Midjourney发布v6.1版本：优化远景人脸，细节更丰富

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来