在人工智能领域持续升温的当下,又一家国内独角兽企业MiniMax宣布正式加入视频生成模型的激烈竞争。8月31日,MiniMax在上海成功举办“MiniMax Link伙伴日”活动,创始人闫俊杰在活动中高调亮相,并宣布了公司最新研发的视频生成模型及音乐模型,标志着这家一向低调的“AI六小龙”成员正式踏入视频生成的新蓝海。
活动中,闫俊杰重点介绍了名为“video-1”的视频生成模型,该模型以其高压缩率、卓越的文本响应能力和多样化的风格著称,能够生成原生高清、高帧率的视频内容。尽管具体技术细节尚未全面披露,但闫俊杰透露,video-1目前支持文生视频功能,未来还将迭代升级至图生视频、可编辑及高度可控等先进功能,为用户带来前所未有的创作体验。
现场体验环节中,记者通过输入简单提示词,仅耗时1-2分钟便成功生成了一段6秒的视频,画面清晰,色调和谐,展现了video-1模型的初步实力。不过,闫俊杰也坦诚指出,当前模型在人物面部细节处理上仍有提升空间。
在大会讨论中,闫俊杰深入剖析了大模型领域的诸多非共识问题,如市场定位(2B vs 2C)、地域选择(国内 vs 海外)以及Scaling law的可持续性等。他强调,尽管存在诸多不确定因素,但视频生成已成为行业内广泛认可的未来发展方向。
自今年年初以来,视频生成模型领域迎来了爆发式增长。从OpenAI的Sora到生数科技的Vidu,再到快手、Luma AI、Runway、阿里达摩院、爱诗科技及智谱等企业的相继布局,短短数月间,数十款视频生成模型如雨后春笋般涌现,标志着AI视频生成技术正式迈入历史性的发展阶段。
闫俊杰表示,MiniMax之所以选择布局视频生成,是因为人类社会的信息传递正越来越多地依赖于多模态内容。他指出,日常生活中的大量信息通过语音、视频等非文本形式传递,这要求大模型厂商必须能够输出多样化的内容形态,以满足用户的广泛需求。
然而,他也坦言,视频生成技术的挑战不容小觑。当前模型在物理规则理解、生成过程控制等方面仍存在诸多不足,且视频数据的处理难度远高于文本,对基础设施和研发耐心提出了更高的要求。尽管如此,闫俊杰对MiniMax的技术实力充满信心,并表示将持续投入资源,推动视频生成技术的不断突破。
随着启明创投等投资机构对生成式AI未来趋势的乐观预测,视频生成领域的全面爆发似乎已指日可待。MiniMax的加入无疑为这一赛道注入了新的活力,也为未来的影视、动画、短片生产模式带来了无限可能。