数据集:

Maysee/tiny-imagenet

语言:

en

计算机处理:

monolingual

大小:

100K<n<1M

语言创建人:

crowdsourced

批注创建人:

crowdsourced
英文

tiny-imagenet 数据集卡片

数据集概述

Tiny ImageNet 包含100000张图像,分为200个类别(每个类别500张图像),图像大小为64×64像素。每个类别有500张训练图像,50张验证图像和50张测试图像。

语言

数据集中的类别标签为英文。

数据集结构

数据实例

{
  'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=64x64 at 0x1A800E8E190,
  'label': 15
}

数据字段

  • image: 一个包含图像的PIL.Image.Image对象。请注意,在访问图像列时: dataset[0]["image"],图像文件会自动解码。解码大量图像文件可能需要相当长的时间。因此,首先查询样本索引,然后才是 "image" 列,即应始终首选 dataset[0]["image"] 而不是 dataset["image"][0]。
  • label: 一个整数分类标签。测试集的标签为-1,因为标签不可用。请查看 classes.py 获取数字和标签之间的映射关系。

数据拆分

Train Valid
# of samples 100000 10000

使用方式

示例

加载数据集
def example_usage():
    tiny_imagenet = load_dataset('Maysee/tiny-imagenet', split='train')
    print(tiny_imagenet[0])

if __name__ == '__main__':
    example_usage()