数据集:

frgfm/imagenette

语言:

en

大小:

1K<n<10K

语言创建人:

crowdsourced

批注创建人:

crowdsourced

源数据集:

extended

许可:

apache-2.0
英文

Imagenette 数据集数据卡

数据集概要

Imagenette 数据集是从 Imagenet 中选择出的 10 个易于分类的类别的子集,并且有一些法语。此数据集由 Jeremy Howard 创建,这个仓库只是为了在该平台上共享他的工作。仓库所有者对数据集的创建、策划或打包不承担任何责任。

支持的任务和排行榜

  • 图像分类:该数据集可用于训练图像分类模型。

语言

数据集中的类别标签为英文。

数据集结构

数据实例

数据点包括图像的 URL 和其分类标签。

{
  'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=320x320 at 0x19FA12186D8>,
  'label': 'tench',
}

数据字段

  • image:包含图像的 PIL.Image.Image 对象。
  • label:图像的预期类别标签。

数据拆分

train validation
imagenette 9469 3925

数据集创建

策划原因

https://huggingface.co/datasets/imagenet-1k#curation-rationale

源数据

初始数据收集和归一化

Imagenette 是 ImageNet 的一个子集。有关源数据收集的信息,请参阅 here

注释

注释过程

https://huggingface.co/datasets/imagenet-1k#annotation-process

注释者是谁?

https://huggingface.co/datasets/imagenet-1k#who-are-the-annotators

个人和敏感信息

https://huggingface.co/datasets/imagenet-1k#personal-and-sensitive-information

使用数据的注意事项

数据的社会影响

https://huggingface.co/datasets/imagenet-1k#social-impact-of-dataset

偏见讨论

https://huggingface.co/datasets/imagenet-1k#discussion-of-biases

其他已知限制

https://huggingface.co/datasets/imagenet-1k#other-known-limitations

其他信息

数据集策划者

https://huggingface.co/datasets/imagenet-1k#dataset-curators 和 Jeremy Howard

许可信息

Apache License 2.0

引用信息

@software{Howard_Imagenette_2019,
    title={Imagenette: A smaller subset of 10 easily classified classes from Imagenet},
    author={Jeremy Howard},
    year={2019},
    month={March},
    publisher = {GitHub},
    url = {https://github.com/fastai/imagenette}
}

贡献

此数据集由 Jeremy Howard 创建,并于 Github 发布。然后由 @frgfm 将其集成到 HuggingFace Datasets 中。