模型:

openmmlab/upernet-swin-base

英文

UperNet,Swin Transformer基本大小的骨干

UperNet是一个语义分割的框架,利用Swin Transformer骨干。UperNet在Xiao等人的论文 Unified Perceptual Parsing for Scene Understanding 中提出。

将UperNet与Swin Transformer骨干结合在一起是在 Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文中提出的。

免责声明:发布UperNet + Swin Transformer的团队没有为该模型编写模型卡,因此这个模型卡是由Hugging Face团队编写的。

模型描述

UperNet是一个语义分割的框架。它由多个组件组成,包括一个骨干、一个特征金字塔网络(FPN)和一个金字塔池化模块(PPM)。

任何视觉骨干都可以插入UperNet框架中。该框架预测每个像素的语义标签。

使用目的和限制

您可以使用原始模型进行语义分割。查看 model hub 以寻找您感兴趣的任务上经过微调的版本(具有不同的骨干)。

如何使用

有关代码示例,请参阅 documentation