UperNet是一个语义分割的框架,利用了ConvNeXt骨干。UperNet是由Xiao等人在 Unified Perceptual Parsing for Scene Understanding 论文中提出的。
将UperNet与ConvNeXt骨干结合是在 A ConvNet for the 2020s 论文中介绍的。
免责声明:发布UperNet + ConvNeXt的团队未为该模型编写模型卡,因此这个模型卡是Hugging Face团队编写的。
UperNet是一个语义分割的框架。它包括多个组件,包括一个骨干、一个特征金字塔网络(FPN)和一个金字塔池化模块(PPM)。
任何视觉骨干都可以被插入UperNet框架。该框架对每个像素预测一个语义标签。
你可以使用原始模型进行语义分割。查看 model hub 以寻找您感兴趣的任务的精调版本(具有各种骨干)。
有关代码示例,请参阅 documentation 。