Midjourney计划未来几个月内发布AI视频生成模型

2024年01月04日由 daydream 发表 459 0

作为一个生成式图像创造工具，Midjourney或许最著名的是它在Discord服务器内的运行，现在它正在拓展其人工智能的领域。Midjourney的创造者们在周二宣布，他们计划在接下来的几个月内推出一款“文本到视频”的模型。

微信截图_20240104095729

公司将从1月份开始训练其视频模型，首席执行官David Holz在一个“办公时间”Discord会议期间如此表示。此举对于平台来说是一个自然的进步，它基于成熟的图像模型，以激发生成式视频行业的竞争动态。

会议记录包括计划对V6 Niji——Midjourney的漫画/动画生成模型——进行调整，以及为Midjourney V6即将发布的官方版本修复一致性问题。公司还写道，其待办事项包括“开始训练新的视频模型”，可能“在几个月内”就可以准备好。

Holz和Midjourney团队均未分享有关该模型的更多信息。

Midjourney以强调质量和用户体验而非追求速度而闻名——即使这意味着落后于竞争对手。在Stable Diffusion等其他平台将内部填充和外部扩展等功能变成事实后几个月，该公司推出了增强功能，其最近涉足的初级文本生成是在Dall-E 3、SDXL甚至一些不太受欢迎的生成器如Ideogram或IF等其他模型已经成为常见能力之后。

进入拥挤的领域

在竞争对手发布新产品之后，Midjourney也涉足视频领域。Stability AI近期宣布了Stable Video Diffusion；Meta刚刚展示了其EMU视频生成器，而像Pika和Runway ML这样的现有模型也正在标定它们的领域，这使得Midjourney将面临一个稳固的竞争格局。此外，其他像Leonardo AI这样的图像生成器已经实现了视频生成能力，进一步加剧了竞争。

Midjourney最近推出的v6更新，拥有改进的提示跟随能力和更逼真的图像，是公司为了保持相关性和竞争力做出的最新努力。如果它的模型展示出一些内聚性，它们甚至可能在这样一个初生领域内获得坚实的基础——尽管模型仍然远非完美。

这些发展的影响远非仅限于公司之间争夺霸权。随着Midjourney和其他公司创新和完善他们的产品，创意和媒体行业正处于一个变革性的时代边缘。通过人工智能生成、操纵和与视频内容互动的能力为我们开启了许多可能性——从为娱乐者和广告商简化工作，到可能重塑我们对现实的感知方式。

文章来源：https://decrypt.co/211583/midjourney-leaps-into-ai-video-creation

标签：

Midjourney AI 视频

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇字节跳动推出DiffPortrait3D：突破单图合成技术实现多角度3D人像生成

下一篇 Getty和Nvidia将生成式AI引入库存照片

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来