UperNet 框架用于语义分割,利用了 ConvNeXt 主干。Xiao 等人在论文 Unified Perceptual Parsing for Scene Understanding 中介绍了 UperNet。
将 UperNet 与 ConvNeXt 主干结合是在论文 A ConvNet for the 2020s 中提出的。
免责声明:发布 UperNet + ConvNeXt 的团队没有为该模型编写模型卡,因此该模型卡由 Hugging Face 团队编写。
UperNet 是一种用于语义分割的框架。它由几个组件组成,包括主干、特征金字塔网络(FPN)和金字塔池化模块(PPM)。
任何视觉主干都可以插入 UperNet 框架中。该框架预测每个像素的语义标签。
您可以使用原始模型进行语义分割。查看 model hub ,寻找您感兴趣的任务上的微调版本(使用不同的主干)。
有关代码示例,请参阅 documentation 。