TransPixar:Adobe与香港科大合作推出RGBA视频生成新技术

2025年01月13日 由 daydream 发表 333 0

近日,Adobe与香港科技大学合作研发了一项名为TransPixar的新技术,该技术为视觉特效领域带来了革新性的进展。TransPixar能够生成带有RGBA通道的视频,实现了AI生成视频中透明度的自然呈现,这对于创建烟雾、反射和爆炸等无缝融入数字环境的特效至关重要。


微信截图_20250113092029


TransPixar技术的核心在于其能够同时生成RGB(颜色)和alpha(透明度)通道的视频。这一功能是通过精细调整的扩散变换器(DiT)模型和基于LoRA的适应机制实现的,确保了RGB和alpha层之间的高度一致性。针对训练数据有限的问题,该技术优化了注意力机制,从而保持了视频质量,并确保了RGB与alpha通道的对齐。


长期以来,视觉特效领域一直依赖alpha通道来实现透明元素,如烟雾、水和玻璃等效果的生动呈现。然而,在AI生成的视频中实现这些效果一直具有挑战性,主要原因是训练数据集稀缺以及现有模型适应的技术障碍。TransPixar通过引入一个高效的框架,解决了这一问题,该框架能够生成结合RGB和alpha通道的RGBA视频。


TransPixar基于广泛认可的扩散变换器模型,这些模型在捕捉复杂的时空依赖性方面表现出色。但TransPixar更进一步,通过引入alpha特定标记和基于LoRA的微调机制,实现了RGB和alpha通道的同步生成。这种联合生成确保了颜色和透明度层之间的无缝对齐,消除了预测-生成管道的限制。


该技术的创新之处在于其注意力机制的处理方法。研究团队优化了RGB和alpha标记之间的相互作用,确保一个通道的变化能够影响另一个通道。同时,他们消除了文本输入和alpha标记之间的注意力,以减少干扰,保持原始模型在RGB生成方面的质量。


TransPixar的应用潜力巨大。演示视频展示了如旋转的小行星带和噼啪作响的魔法门等动态场景,这些场景均由简单的文本提示生成。此外,该技术还能将静态图像动画化为透明视频,进一步拓宽了其应用场景。


除了电影和游戏领域,TransPixar在虚拟现实、增强现实和教育等领域也具有广泛应用前景。它能够生成透明且动态的视觉效果,为这些领域带来了新的可能性。目前,该技术以开源形式发布在GitHub上,同时还有一个交互式演示在Hugging Face平台上可供体验。


值得注意的是,尽管TransPixar具有诸多优势,但其计算需求仍然较高。然而,研究人员指出,未来的优化可能会降低其成本,使其更适合小型工作室和独立开发者使用。


随着视觉特效预算的不断攀升,像TransPixar这样的工具有助于工作室降低成本,同时不牺牲创意追求。对于规模较小的参与者而言,该技术可能有助于缩小与行业巨头的差距,使其更容易在竞争中脱颖而出。

文章来源:https://www.maginative.com/article/adobes-new-ai-transpixar-adds-transparency-to-generated-videos/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消