OpenAI正在推出其最新的文本到图像生成器,使其具有更广泛使用性。该公司将在周四向ChatGPT Plus和Enterprise客户提供访问新的DALL-E 3模型的权限,该模型可在ChatGPT应用程序内运行。 OpenAI表示,它已经为该模型准备了安全缓解堆栈,使其准备进行扩展发布。
DALL-E 3于上个月首次发布,OpenAI展示了它如何改进以前的DALL-E 2,允许用户利用ChatGPT编写更长,更具视觉描述性的提示提供给图像生成器。DALL-E 3已添加到Bing Chat和Bing Image Generator中,使Microsoft成为首个引入该模型的平台——甚至早于ChatGPT。
广告中宣传的减少有害图像的护栏并不总是有效,即使在微软屏蔽了某些提示之后,其他简单的方法也无法得到理想的结果。
像Midjourney、Stable Diffusion和较早的DALL-E迭代这样的文本到图像生成器都有自己的争议。该技术输出了版权图像材料、未经同意的裸照、对象的种族变化,以及对公众人物的逼真歪曲。
OpenAI承诺这次将采取更有效的措施,并提供了一个网站展示DALL-E 3的研究。该公司表示,它将“限制该模型生成在世艺术家风格的内容,以及公众人物图像的可能性,并提高生成图像的代表性。OpenAI还有一个内部的“来源分类器”工具,它说它能够以99%的准确率检测图像是否由DALL-E 3生成。