数据集:

zh-plus/tiny-imagenet

批注创建人:

crowdsourced

语言创建人:

crowdsourced

大小:

100K<n<1M

计算机处理:

monolingual

语言:

en
英文

tiny-imagenet 数据集卡片

数据集概述

Tiny ImageNet 包含 100000 张图片,涵盖了200个类别(每个类别有500张图片),图片大小为64×64,并且为彩色图片。每个类别有500张训练图片,50张验证图片和50张测试图片。

语言

数据集中的类别标签为英文。

数据集结构

数据实例

{
  'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=64x64 at 0x1A800E8E190,
  'label': 15
}

数据字段

  • image: 包含图片的PIL.Image.Image对象。注意,当访问图片列时,dataset[0]["image"] 会自动解码图片文件。解码大量图片文件可能需要较长时间。因此,在访问"image"列之前,首先查询样本索引是很重要的,即应优先选择 dataset[0]["image"] 而不是 dataset["image"][0]。
  • label: 一个整数分类标签。测试集的标签为-1,因为标签缺失。请参考 classes.py 获取数字与标签之间的映射关系。

数据拆分

Train Valid
# of samples 100000 10000

使用方法

示例

加载数据集
def example_usage():
    tiny_imagenet = load_dataset('Maysee/tiny-imagenet', split='train')
    print(tiny_imagenet[0])

if __name__ == '__main__':
    example_usage()