在线购物往往难以预料,因为在购买前不容易直观地看到产品。亚马逊希望通过引入Diffuse to Choose(DTC)来改变这一现状,这是一个新的AI系统,允许你在任何环境中虚拟试用产品。
在亚马逊研究人员发布的一篇新论文中,DTC允许购物者将产品图像无缝融合到他们的个人照片中。这创造了一个“虚拟试穿”体验,其中物品看起来真实地融入了所需的场景或设置。
论文解释说:“最近的扩散模型内在包含了一个世界模型,使它们适合在修复上下文中执行这项任务。然而,传统的图像条件扩散模型往往无法捕捉产品的精细细节。”
DTC通过采用一种新颖的基于扩散的图像条件修复模型来解决这一问题。该模型独特地平衡了快速推理与保留高保真细节,确保在任何给定场景中进行准确的语义操作。在这里,使用一个次要的U-Net编码器将细粒度细节注入扩散过程是一个关键的创新。这个过程涉及对源图像进行遮罩并将参考图像插入遮罩区域,然后是模型内的一系列复杂的适应和对齐。
该论文在专有和公共数据集上验证了DTC,证明了其相对于Paint By Example(一种流行的基于扩散的修复技术)在定量和定性方面的优势。重要的是,DTC匹配了少样本个性化方法,而无需对每个产品进行微调。
DTC的实际意义广泛且多样。对于消费者来说,这意味着能够将在线商店中的任何商品放入他们自己的生活空间或个人环境中,实时查看商品的搭配和外观。这不仅增强了购物体验,还有助于做出更明智的购买决策。对于零售商来说,它提供了与客户互动的新水平,通过提供更准确的产品表示,有可能降低退货率。
早期示例显示DTC能够逼真地融合各种产品,从服装到家具和装饰品。一致的光线和阴影使物品看起来真正出现在插入的场景中。
DTC还支持迭代的虚拟装饰和装扮构建。用户可以调整遮罩以改变服装风格,例如塞进衣服或卷起袖子。这种灵活性将DTC定位为个性化电子商务体验的引人入胜的平台。
亚马逊并不是唯一一个探索虚拟试穿选项的公司。去年谷歌AI也有类似研究,是他们的TryonDiffusion模型。
虽然谷歌的研究主要集中在提高服装的现实感,但亚马逊的DTC旨在跨产品类别工作。两者都突出了使用AI为在线购物体验创造更沉浸式体验的兴趣增加。
亚马逊表示,它将很快发布代码和演示。如果研究兑现了其承诺,将像DTC这样的工具集成到在线购物体验中可能会引领电子商务的下一个进化。