Midjourney计划未来几个月内发布AI视频生成模型

2024年01月04日 由 daydream 发表 323 0

作为一个生成式图像创造工具,Midjourney或许最著名的是它在Discord服务器内的运行,现在它正在拓展其人工智能的领域。Midjourney的创造者们在周二宣布,他们计划在接下来的几个月内推出一款“文本到视频”的模型。


微信截图_20240104095729


公司将从1月份开始训练其视频模型,首席执行官David Holz在一个“办公时间”Discord会议期间如此表示。此举对于平台来说是一个自然的进步,它基于成熟的图像模型,以激发生成式视频行业的竞争动态。


会议记录包括计划对V6 Niji——Midjourney的漫画/动画生成模型——进行调整,以及为Midjourney V6即将发布的官方版本修复一致性问题。公司还写道,其待办事项包括“开始训练新的视频模型”,可能“在几个月内”就可以准备好。


Holz和Midjourney团队均未分享有关该模型的更多信息。


Midjourney以强调质量和用户体验而非追求速度而闻名——即使这意味着落后于竞争对手。在Stable Diffusion等其他平台将内部填充和外部扩展等功能变成事实后几个月,该公司推出了增强功能,其最近涉足的初级文本生成是在Dall-E 3、SDXL甚至一些不太受欢迎的生成器如Ideogram或IF等其他模型已经成为常见能力之后。


进入拥挤的领域


在竞争对手发布新产品之后,Midjourney也涉足视频领域。Stability AI近期宣布了Stable Video Diffusion;Meta刚刚展示了其EMU视频生成器,而像Pika和Runway ML这样的现有模型也正在标定它们的领域,这使得Midjourney将面临一个稳固的竞争格局。此外,其他像Leonardo AI这样的图像生成器已经实现了视频生成能力,进一步加剧了竞争。


Midjourney最近推出的v6更新,拥有改进的提示跟随能力和更逼真的图像,是公司为了保持相关性和竞争力做出的最新努力。如果它的模型展示出一些内聚性,它们甚至可能在这样一个初生领域内获得坚实的基础——尽管模型仍然远非完美。


这些发展的影响远非仅限于公司之间争夺霸权。随着Midjourney和其他公司创新和完善他们的产品,创意和媒体行业正处于一个变革性的时代边缘。通过人工智能生成、操纵和与视频内容互动的能力为我们开启了许多可能性——从为娱乐者和广告商简化工作,到可能重塑我们对现实的感知方式。

文章来源:https://decrypt.co/211583/midjourney-leaps-into-ai-video-creation
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消