数据集:
detection-datasets/fashionpedia_4_categories
这个数据集是基于Fashionpedia数据集的一种变体,有两个主要区别:
这个数据集的目标是通过减少类别数(从完整的Fashionpedia数据集的46个类别减少到4个类别)来简化检测任务。
这个数据集是使用 detection_datasets 库( GitHub , PyPI ) 创建的,您可以在这里查看完整的创建过程( notebook )。
简而言之,应用了以下映射:
mapping = { 'shirt, blouse': 'clothing', 'top, t-shirt, sweatshirt': 'clothing', 'sweater': 'clothing', 'cardigan': 'clothing', 'jacket': 'clothing', 'vest': 'clothing', 'pants': 'clothing', 'shorts': 'clothing', 'skirt': 'clothing', 'coat': 'clothing', 'dress': 'clothing', 'jumpsuit': 'clothing', 'cape': 'clothing', 'glasses': 'accessories', 'hat': 'accessories', 'headband, head covering, hair accessory': 'accessories', 'tie': 'accessories', 'glove': 'accessories', 'belt': 'accessories', 'tights, stockings': 'accessories', 'sock': 'accessories', 'shoe': 'shoes', 'bag, wallet': 'bags', 'scarf': 'accessories', }
结果是,没有在映射中具有对应类别的注释被删除了。