英文

使用DeepLabV3+进行多类语义分割

此存储库包含模型和笔记本 to this Keras example on Multiclass semantic segmentation using DeepLabV3+

全部感谢: Soumik Rakshit

该模型经过训练仅用于演示目的,并不能保证在生产中获得最佳结果。要获得更好的结果,请根据您的需要遵循优化 Keras example

背景信息

语义分割是一项重要的计算机视觉任务,旨在为图像中的每个像素分配语义标签。在本例中,我们实现了DeepLabV3+模型,用于多类语义分割,这是一种完全卷积的架构,在语义分割基准测试中表现良好。

训练数据

该模型在 Crowd Instance-level Human Parsing Dataset 的子集(10,000张图像)上进行了训练。Crowd Instance-level Human Parsing(CIHP)数据集具有38,280个多样化的人类图像。CIHP中的每个图像都带有20个类别的像素级注释,以及实例级别的标识。此数据集可用于“人体部分分割”任务。

模型

该模型使用在ImageNet上预训练的ResNet50作为骨干模型。

参考文献:

  • Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation
  • Rethinking Atrous Convolution for Semantic Image Segmentation
  • DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs