模型:

openmmlab/upernet-swin-large

英文

UperNet,Swin Transformer 大型骨干

UperNet 是一个语义分割框架,利用了 Swin Transformer 骨干。UperNet 在 Xiao 等人的论文 Unified Perceptual Parsing for Scene Understanding 中被介绍。

将 UperNet 与 Swin Transformer 骨干相结合是在 Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 的论文中提出的。

免责声明:发布 UperNet + Swin Transformer 的团队没有为该模型编写模型卡,因此此模型卡是由Hugging Face团队编写的。

模型描述

UperNet 是一个用于语义分割的框架。它包括多个组件,包括骨干、特征金字塔网络(FPN)和金字塔池化模块(PPM)。

任何视觉骨干都可以插入到 UperNet 框架中。该框架对每个像素预测一个语义标签。

预期用途和限制

您可以使用原始模型进行语义分割。查看 model hub 以寻找您感兴趣的任务的经过微调的版本(使用不同的骨干)。

如何使用

有关代码示例,请参阅 documentation