UperNet是一个语义分割的框架,利用了Swin Transformer骨干。UperNet在Xiao等人的论文 Unified Perceptual Parsing for Scene Understanding 中被介绍。
将UperNet与Swin Transformer骨干结合介绍在 Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文中。
免责声明:发布UperNet + Swin Transformer的团队没有为此模型编写模型卡,因此这个模型卡是由Hugging Face团队编写的。
UperNet是一个语义分割的框架。它包括多个组件,包括骨干、特征金字塔网络(FPN)和金字塔池化模块(PPM)。
任何视觉骨干都可以插入到UperNet框架中。该框架对每个像素预测一个语义标签。
您可以使用原始模型进行语义分割。查看 model hub 以寻找您感兴趣的任务上的精调版本(使用不同的骨干)。
有关代码示例,请参阅 documentation 。