数据集:

huggan/smithsonian_butterflies_subset

英文

这是带有附加处理的“ceyda/smithsonian_butterflies”数据集的子集,用于训练“ceyda/butterfly_gan”模型。

预处理包括:

  • 使用“pretty butterfly”、“one butterfly”、“butterfly with open wings”和“colorful butterfly”将“sim_score”添加到图像中
  • 删除相同名称(物种)的蝴蝶
  • 仅限于前1000张图像
  • 移除背景(在去除背景后进行的另一次sim_scoring效果不如预期,因此没有进行该步骤)
  • 检测轮廓
  • 裁剪到具有最大面积的轮廓的边界框
  • 转换回RGB格式