数据集:

lewtun/dog_food

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

狗狗? 对比食物?(也称为狗粮)数据集的数据卡

数据集摘要

这是一个多类别图像分类的数据集,包括“狗狗”、“鸡肉”和“松饼”类别。

“狗狗”类别包含看起来像炸鸡和松饼图像的狗狗图像,而“鸡肉”和“松饼”类别包含(你猜对了)炸鸡和松饼的图像 ?

支持的任务和排行榜

待确定

语言

标签使用英文(['狗狗','鸡肉','松饼'])

数据集结构

数据实例

下面是训练集的示例:

{
{'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=300x470 at 0x7F176094EF28>, 
'label': 0}

}

数据字段

  • img:一个包含300x470像素图像的PIL.JpegImageFile对象。请注意,访问图像列时:dataset[0]["image"]会自动解码图像文件。解码大量图像文件可能需要很长时间。因此,首先查询样本索引,然后是“image”列,即dataset[0]["image"]始终优于dataset["image"][0]
  • label:0-1之间的数值,对应关系如下:0狗狗,1食物

数据拆分

训练集(1875张图像)和测试集(625张图像)

数据集创建

策划理由

源数据

经过初始化的数据收集和归一化

此数据集来自于 qw2243c/Image-Recognition-Dogs-Fried-Chicken-or-Blueberry-Muffins? GitHub存储库,并随机划分25%的数据用于验证。

注释

注释过程

这些数据是从互联网上爬取的,并根据查询词进行了标注。

个人和敏感信息

使用数据的注意事项

数据集的社会影响

偏见讨论

此数据集是平衡的——狗狗(1000张)、鸡肉(1000张)和松饼(1000张)的图像数量相等。在评估模型时应考虑到这一点。

其他已知限制

其他信息

数据集维护者

此数据集由@lanceyjt、@yl3829、@wesleytao、@qw2243c和@asyouhaveknown创建

许可信息

原始 github repository 未注明任何信息。

引用信息

贡献

感谢 @lewtun 添加此数据集。