Midjourney正在V7的最终测试阶段,这是一个重要的更新,几乎重建了AI图像生成器系统的每个部分。
在本周的办公时间会议上,开发人员解释说,V7具有新的架构、不同的数据集和修订的语言处理方法。
内部测试可能需要一周到一个月,然后是为期两周的调试阶段,以及可能的功能有限的alpha阶段。
“V7模型是V6的全面改革,包括新的架构、不同的数据集和修订的语言处理方法,”Midjourney宣布在其官方服务器上。“初步调试后通常会有一个alpha阶段,启用的功能有限。”
在V7的广泛重构继续进行的同时,Midjourney的团队也在通过多种方法探索视频生成能力,包括开发自己的视频模型或与外部提供商合作。
根据团队的说法,主要挑战在于使视频创作既用户友好又具有成本效益。
团队没有透露这个视频生成器的具体时间表,因此它可能处于较早的开发阶段。目前,开发人员正在根据公告“平衡速度、成本和输出质量”。
大约85%的用户更喜欢使用平台个性化系统生成的图像,该系统现在包括情绪板和多个配置文件,Midjourney表示。公司计划通过将情绪板与风格参考功能结合来扩展这些功能。
平台还计划引入两种不同的生成模式:一种“实时”选项,用于快速获得类似于Meta的“想象”功能、Krea AI的涂鸦到图像功能或Leonardo的实时画布。
他们还在开发一种高容量模式,用于创建类似于Leonardo的Flow状态的大批量图像。
Midjourney V6发布于2023年12月并提供了比其前身Midjourney V5.1更好的结果,后者发布于2023年5月。
结果显著,但从V5到V6的升级没有从V4到V5的升级那么大。Midjourney在谈论V6时更加谨慎因此可以合理地认为团队对结果非常满意,以至于称这个新版本为“全面改革”。
在那段时间,团队还宣布他们正在进入AI硬件市场,但尚未透露更多细节。
自Midjourney V6发布以来,团队已经扩展了其功能,添加了图像编辑器、独立界面、风格定制工具、外绘和图像扩展等功能。
团队还开始关注用户的反馈,分享不同的调查问卷以询问用户希望实现哪些功能。
根据Decrypt的分析,Midjourney目前在创意AI图像生成方面表现出色,持续产生出色的美学效果,令其在竞争对手中脱颖而出。
虽然它可能偶尔牺牲严格的提示遵循和文本渲染准确性,但其多功能性和整体能力使其成为一个强大的工具。
添加可定制的风格进一步增强了其吸引力,使用户能够创建与平台标志性外观大不相同的独特个性化图像。
文章来源:https://decrypt.co/300298/midjourney-inches-closer-to-complete-overhaul-plans-video-features