这是带有附加处理的“ceyda/smithsonian_butterflies”数据集的子集,用于训练“ceyda/butterfly_gan”模型。
预处理包括:
- 使用“pretty butterfly”、“one butterfly”、“butterfly with open wings”和“colorful butterfly”将“sim_score”添加到图像中
- 删除相同名称(物种)的蝴蝶
- 仅限于前1000张图像
- 移除背景(在去除背景后进行的另一次sim_scoring效果不如预期,因此没有进行该步骤)
- 检测轮廓
- 裁剪到具有最大面积的轮廓的边界框
- 转换回RGB格式