TransPixar：Adobe与香港科大合作推出RGBA视频生成新技术

2025年01月13日由 daydream 发表 621 0

近日，Adobe与香港科技大学合作研发了一项名为TransPixar的新技术，该技术为视觉特效领域带来了革新性的进展。TransPixar能够生成带有RGBA通道的视频，实现了AI生成视频中透明度的自然呈现，这对于创建烟雾、反射和爆炸等无缝融入数字环境的特效至关重要。

微信截图_20250113092029

TransPixar技术的核心在于其能够同时生成RGB（颜色）和alpha（透明度）通道的视频。这一功能是通过精细调整的扩散变换器（DiT）模型和基于LoRA的适应机制实现的，确保了RGB和alpha层之间的高度一致性。针对训练数据有限的问题，该技术优化了注意力机制，从而保持了视频质量，并确保了RGB与alpha通道的对齐。

长期以来，视觉特效领域一直依赖alpha通道来实现透明元素，如烟雾、水和玻璃等效果的生动呈现。然而，在AI生成的视频中实现这些效果一直具有挑战性，主要原因是训练数据集稀缺以及现有模型适应的技术障碍。TransPixar通过引入一个高效的框架，解决了这一问题，该框架能够生成结合RGB和alpha通道的RGBA视频。

TransPixar基于广泛认可的扩散变换器模型，这些模型在捕捉复杂的时空依赖性方面表现出色。但TransPixar更进一步，通过引入alpha特定标记和基于LoRA的微调机制，实现了RGB和alpha通道的同步生成。这种联合生成确保了颜色和透明度层之间的无缝对齐，消除了预测-生成管道的限制。

该技术的创新之处在于其注意力机制的处理方法。研究团队优化了RGB和alpha标记之间的相互作用，确保一个通道的变化能够影响另一个通道。同时，他们消除了文本输入和alpha标记之间的注意力，以减少干扰，保持原始模型在RGB生成方面的质量。

TransPixar的应用潜力巨大。演示视频展示了如旋转的小行星带和噼啪作响的魔法门等动态场景，这些场景均由简单的文本提示生成。此外，该技术还能将静态图像动画化为透明视频，进一步拓宽了其应用场景。

除了电影和游戏领域，TransPixar在虚拟现实、增强现实和教育等领域也具有广泛应用前景。它能够生成透明且动态的视觉效果，为这些领域带来了新的可能性。目前，该技术以开源形式发布在GitHub上，同时还有一个交互式演示在Hugging Face平台上可供体验。

值得注意的是，尽管TransPixar具有诸多优势，但其计算需求仍然较高。然而，研究人员指出，未来的优化可能会降低其成本，使其更适合小型工作室和独立开发者使用。

随着视觉特效预算的不断攀升，像TransPixar这样的工具有助于工作室降低成本，同时不牺牲创意追求。对于规模较小的参与者而言，该技术可能有助于缩小与行业巨头的差距，使其更容易在竞争中脱颖而出。

文章来源：https://www.maginative.com/article/adobes-new-ai-transpixar-adds-transparency-to-generated-videos/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Midjourney接近“全面改革”，计划推出视频功能

下一篇 Adobe推出Firefly Bulk Create工具，实现数万张图像批量编辑

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来