数据集:

nateraw/sync_food101

语言:

en

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

crowdsourced

批注创建人:

crowdsourced
英文

Food-101 数据集卡片

数据集概述

该数据集包含101个食物类别,共有101,000张图像。对于每个类别,提供了250张经过手动审核的测试图像以及750张训练图像。故意地,训练图像没有进行清理,因此仍然包含一些噪音。这些噪音主要以强烈的颜色形式存在,有时也会有错误的标签。所有图像都被重新调整大小,使其最大边长为512像素。

支持的任务和排行榜

  • 图像分类

语言

英语

数据集结构

数据实例

下面提供了训练集的一个样本:

{
  'image': '/root/.cache/huggingface/datasets/downloads/extracted/6e1e8c9052e9f3f7ecbcb4b90860668f81c1d36d86cc9606d49066f8da8bfb4f/food-101/images/churros/1004234.jpg',
  'label': 23
}

数据字段

数据实例具有以下字段:

  • image:一个字符串,表示图像的文件路径。
  • label:一个整数,表示分类标签。

数据拆分

name train validation
food101 75750 25250

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

谁是源语言制作人?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据时的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

 @inproceedings{bossard14,
  title = {Food-101 -- Mining Discriminative Components with Random Forests},
  author = {Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc},
  booktitle = {European Conference on Computer Vision},
  year = {2014}
}

贡献

感谢 @nateraw 添加此数据集。