亚马逊Titan击败谷歌的Imagen和Meta的CM3leon

2023年12月01日 由 samoyed 发表 238 0

亚马逊推出重视道德的数据使用和不可见水印的Titan Image Generator,加入了这场文本到图像的人工智能竞赛。


亚马逊的基础模型组合Titan迎来了新成员:Titan Image Generator。本周,在拉斯维加斯的re:Invent大会上,分析和机器学习副总裁Swami Sivasubramaniam宣布了Titan Image Generator。并表示这个工具现已提供预览版。他接着说:“你可以用自己的数据定制这些图像,创造更好反映你的行业或品牌的内容。”


a-2


亚马逊已经加入了文本到图像模型的市场,与Adobe Firefly并驾齐驱。尽管现在评价尚早,但Titan的竞争对手已经面临挑战。例如,谷歌的Imagen承认编码偏见,有时会产生种族歧视或有毒的输出。 DALL.E、Stable Diffusion等其他工具也观察到了类似问题。


据说模型是在“多元化数据集”上训练的,尽管Subramaniam拒绝详细说明数据来源。在宣布时Sivasubramanian说:“我们非常谨慎地选择如何训练我们的模型以及我们使用的数据。”


亚马逊AWS是最大的计算能力和数据存储租赁提供商。但是它在推出基于自己文本到图片模型的产品方面滞后于OpenAI和Microsoft Bing Image Creator。自从四月份基础版发布以来,亚马逊的Titan系列增加了新模型,包括一些旨在比OpenAI的最新版本更便宜地生成文本的模型。尽管大型科技公司对于像Imagen和CM3leon这样的图像模型保持谨慎,不向公众发布,但Midjourney、RunwayML、Stability AI和Stable Diffusion已经拥有了活跃的用户基础。


他们大多数人不愿发布的主要原因是因为安全性以及产生有害、有偏见和刻板印象图像的风险。Runway ML、Midjourney、Stability AI和Stable Diffusion保留了禁止用户创建有害图像的权利,而且平台不处理淫秽指令。与此同时,亚马逊也做了同样的事情,并建立了防止偏见的安全措施。据说该功能会拒绝不安全的主题,并检查用户输入和输出。


相比之下,亚马逊拒绝发布模型所训练的数据集,并只相信它内置了对抗有害内容的缓解措施。在re:Invent上,Swami Sivasubramaniam说,“Titan Image Generator是在多样化的数据集上训练的,以便你能创建更准确的输出。”


为了对抗知识产权盗窃,以及区分AI生成图像与真实图像,亚马逊在他们的输出中增加了不可见的水印。除了创建新图像外,Titan图像生成器还允许用户隔离、提取或集成新组件并编辑图像。最有用的应用包括更换背景设置或将物品融入生活照片中。


亚马逊也在押注,试图吸引其他大型模型制造商向AWS客户提供他们的软件。与已经存在的平台不同的是,他们的主要模型侧重于B2B市场。Swami Sivasubramanian在公司的发布中说:“生成式AI被认为是我们这个时代最具变革性的技术,我们因客户将其应用到新的机遇和解决商业挑战上而感到鼓舞。”


亚马逊还强调了该模型针对不同领域的适用性,例如电子商务、广告和娱乐。例如,公司可以用他们的专有图像定制模型,以维持统一的视觉风格。


今年早些时候,亚马逊同意向AI初创公司Anthropic投资多达40亿美元。Sivasubramanian说,根据这项协议,AWS客户可以使用Anthropic的Claude模型,包括上周发布的一个。他还说,亚马逊提供了Meta Platforms公司的Llama模型的更新版本。“随着客户将生成性人工智能融入到他们的业务中,他们转向亚马逊Bedrock,以获得领先的型号、定制功能、代理功能以及企业级的安全和隐私,从而获得完全管理的体验。”

文章来源:https://analyticsindiamag.com/amazon-titan-crushes-googles-imagen-metas-cm3leon/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消