数据集:

detection-datasets/fashionpedia_4_categories

英文

Fashionpedia_4_categories 数据集卡片

这个数据集是基于Fashionpedia数据集的一种变体,有两个主要区别:

  • 它只包含四个类别:
    • 服装
    • 鞋子
    • 包包
    • 饰品
  • 创建了新的数据集分割:
    • 训练集:图像的90%
    • 验证集:5%
    • 测试集:5%

这个数据集的目标是通过减少类别数(从完整的Fashionpedia数据集的46个类别减少到4个类别)来简化检测任务。

这个数据集是使用 detection_datasets 库( GitHub , PyPI ) 创建的,您可以在这里查看完整的创建过程( notebook )。

简而言之,应用了以下映射:

mapping = {
    'shirt, blouse': 'clothing',
    'top, t-shirt, sweatshirt': 'clothing',
    'sweater': 'clothing',
    'cardigan': 'clothing',
    'jacket': 'clothing',
    'vest': 'clothing',
    'pants': 'clothing',
    'shorts': 'clothing',
    'skirt': 'clothing',
    'coat': 'clothing',
    'dress': 'clothing',
    'jumpsuit': 'clothing',
    'cape': 'clothing',
    'glasses': 'accessories',
    'hat': 'accessories',
    'headband, head covering, hair accessory': 'accessories',
    'tie': 'accessories',
    'glove': 'accessories',
    'belt': 'accessories',
    'tights, stockings': 'accessories',
    'sock': 'accessories',
    'shoe': 'shoes',
    'bag, wallet': 'bags',
    'scarf': 'accessories',
}

结果是,没有在映射中具有对应类别的注释被删除了。