UperNet是一种语义分割的框架,利用了ConvNeXt骨干网络。UperNet由Xiao等人在论文 Unified Perceptual Parsing for Scene Understanding 中提出。
将UperNet与ConvNeXt骨干网络结合在一起是在论文 A ConvNet for the 2020s 中介绍的。
免责声明:发布UperNet + ConvNeXt的团队未为此模型撰写模型卡,因此该模型卡由Hugging Face团队撰写。
UperNet是一种用于语义分割的框架。它包括多个组件,包括骨干网络、特征金字塔网络(FPN)和金字塔池化模块(PPM)。
任何视觉骨干网络都可以插入UperNet框架中。该框架对每个像素预测一个语义标签。
您可以使用原始模型进行语义分割。请查看 model hub 以查找您感兴趣的任务的精调版本(具有各种骨干网络)。
有关代码示例,请参阅 documentation 。