UperNet是一个语义分割的框架,利用了ConvNeXt骨干网络。UperNet是由Xiao等人在 Unified Perceptual Parsing for Scene Understanding 论文中提出的。
将UperNet与ConvNeXt骨干网络相结合是在 A ConvNet for the 2020s 论文中引入的。
免责声明:发布UperNet + ConvNeXt的团队没有为该模型编写模型卡片,因此该模型卡片由Hugging Face团队编写。
UperNet是一个语义分割的框架。它包括多个组件,包括骨干网络、特征金字塔网络(FPN)和金字塔池化模块(PPM)。
任何视觉骨干网络都可以插入到UperNet框架中。该框架预测每个像素的语义标签。
您可以使用原始模型进行语义分割。请查看 model hub 以寻找您感兴趣的任务上的微调版本(具有不同的骨干网络)。
有关代码示例,请参阅 documentation 。