数据集:

nateraw/food101

语言:

en

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

crowdsourced

批注创建人:

crowdsourced
英文

Food-101数据集介绍

数据集概要

该数据集包含101个食物类别,共有101,000张图像。对于每个类别,还提供了250张经过人工审核的测试图像和750张训练图像。训练图像故意没有经过清洗,因此仍然包含一些噪点。这主要表现为颜色强烈和有时错误的标签。所有图像都被重新缩放,最大边长为512像素。

支持的任务和排行榜

  • 图像分类

语言

英语

数据集结构

数据示例

下面提供了训练集的样本:

{
  'image': '/root/.cache/huggingface/datasets/downloads/extracted/6e1e8c9052e9f3f7ecbcb4b90860668f81c1d36d86cc9606d49066f8da8bfb4f/food-101/images/churros/1004234.jpg',
  'label': 23
}

数据字段

数据实例具有以下字段:

  • 图像:字符串,指向图像的文件路径。
  • 标签:整数,分类标签。

数据拆分

name train validation
food101 75750 25250

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和归一化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

 @inproceedings{bossard14,
  title = {Food-101 -- Mining Discriminative Components with Random Forests},
  author = {Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc},
  booktitle = {European Conference on Computer Vision},
  year = {2014}
}

贡献者

感谢 @nateraw 添加此数据集。