Stability AI宣布了其Stable Diffusion平台的几项新增强功能。这些更新不仅为文本转图像提供了令人兴奋的新能力,还进入了三维内容创作的领域。
最值得注意的增强是全新的Stable 3D模型。迄今为止,Stable Diffusion主要用于二维(2D)图像生成。Stable 3D模型将改变这一情况,提供的功能可用于任何类型的三维内容创建,包括平面设计甚至视频游戏开发。
除了进军三维内容生成领域外,Stability AI还推出了天空替换工具(Sky Replacer),正如其名称所示,用于在二维图像中替换天空。
Stable Diffusion平台还提供了Stable Fine-Tuning,旨在帮助企业加快特定用例的图像微调过程。
此外,该公司还将在Stability AI API生成的图像中集成不可见水印来进行内容认证。这些新的更新旨在帮助企业在生成式人工智能越来越成为常规工作流程的一部分时进行创意开发。
Stability AI的首席执行官埃马德·莫斯塔基(Emad Mostaque)在接受采访时表示:“这是为创意叙述者提供所需工具的一种方式,使他们能够对图像具有额外的控制水平。”
Stable Diffusion在竞争激烈的GenAI领域增加了功能
Stability AI的进步正值文本-图像生成市场日益竞争激烈之际。
Adobe通过其与该公司设计软件紧密集成的Firefly工具进军该市场。Midjourney正在不断增加其技术的新功能,帮助设计师生成图像。与此同时,OpenAI最近发布了其具有改进能力的DALL-E 3模型,用于生成图像内的文本。
莫斯塔基对其竞争对手非常了解,并努力通过多种方式将Stability AI与其他公司区分开来。特别是,他强调他的公司现在不再只是关于模型,而是关于实现创意流程。他指出,新的天空替换和微调功能是超越生成图像的核心基本模型的额外步骤。
天空替换不仅是一个功能,也是企业用例的一个关注点
替换图像背景的概念并不新鲜。在非生成式人工智能应用中,背景通常通过绿幕和色度键等技术进行替换。
莫斯塔基表示,Stability AI正在基于这些经典技术的基础上构建自动化工作流程,以便为企业用户快速高效地进行背景替换。更改天空的背景颜色不仅仅是为了增加一些创意,它还具有非常具体和实际的用例。
莫斯塔基说:"天空替换对于房地产行业来说非常棒。"
莫斯塔基指出,用户希望能够拥有不同的背景,并带有不同的光照效果。从根本上讲,他强调这一切都是为了提供控制,因为组织机构有自己的工作流程来生成图像和内容。Stability AI所做的是构建优化工作流程,以帮助实现不同用例所需的控制。
他说:"Sky Replacer是我们即将推出的一系列非常专业和企业特定的工具中的第一个,在过去的六到十二个月中,我们已经有了相关经验。"
Stable 3D扩展了Stable Diffusion的应用场景
新的Stable 3D模型通过扩展Stable Diffusion中使用的扩散模型,增加了额外的三维数据集和矢量化功能。
莫斯塔基表示:"我对于能够创建整个三维世界的能力感到非常兴奋。"
莫斯塔基解释说,Stable 3D是基于Stable Diffusion和Stability AI在Objaverse-XL上的工作构建的,Objaverse-XL是世界上最大的开放三维数据集之一。构建和渲染三维图像长期以来一直是一项耗费资源的过程,但莫斯塔基对于Stable 3D比传统的三维图像生成方法更高效持乐观态度。他强调,Stable AI还处于初期阶段,但他对该技术将逐步发展和扩展持乐观态度。Stable 3D最初将作为私人预览版提供。
他说:"与经典的三维模型创建相比,这非常高效。过去需要很长时间来构建的事情,现在可以迅速获得初步结果。"
水印和内容凭证
Stability AI现在正在将不可见的水印和内容凭证集成到其API中。内容凭证是Adobe和其他公司正在参与的一个多供应商行业努力,旨在提供关于内容的作者信息。莫斯塔基表示,添加不可见水印和内容凭证是一种负责任的做法。这也是Stability AI正在进行的更广泛努力的一部分,旨在为生成的内容带来真实性。
莫斯塔基说:"我们正在开创许多举措,以及我们将在该领域宣布的其他一些举措,以及额外的研究,因为我们想要知道什么是真实的,什么是伪造的。这也有助于我们为将来的发布构建的一些归属和其他机制。"