豆包大模型团队联合高校开源视频生成模型VideoWorld | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

豆包大模型团队联合高校开源视频生成模型VideoWorld

2025年02月10日由 daydream 发表 572 0

豆包大模型团队携手北京交通大学与中国科学技术大学，共同研发的视频生成实验模型VideoWorld已正式对外开源。该模型在业界实现了一项重要突破：无需依赖语言模型，即可完成对世界的认知。

微信截图_20250210155740

据悉，当前主流的多模态模型，如Sora、DALL-E和Midjourney等，大多依赖于语言或标签数据来进行知识学习。然而，语言在描述真实世界的所有知识时存在局限性。例如，折纸、打领结等复杂技能，往往难以通过语言进行精确描述。VideoWorld则摒弃了语言模型，实现了统一执行理解和推理任务的能力。

VideoWorld基于一种潜在动态模型构建，该模型能够有效压缩视频帧间的变化信息，从而提高了知识学习的效率和效果。值得注意的是，在没有依赖任何强化学习搜索或奖励函数机制的情况下，VideoWorld已经达到了专业5段9x9围棋的水平，并且能够在多种环境中执行机器人任务。

此次开源的VideoWorld模型，为视频生成和认知领域带来了新的研究方向和技术支持，有望推动相关技术的进一步发展。

文章来源：https://www.atyun.com/65378.html

标签：

豆包视频 VideoWorld

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Adobe Premiere Pro新测试版惊艳亮相：增加AI搜索功能

下一篇 Adobe推出适合创意专业人士的商业安全AI视频模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

本周热门

更多资讯 »

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消