数据集:

Bingsu/Cat_and_Dog

语言:

en

大小:

1K<n<10K

源数据集:

original

许可:

cc0-1.0
英文

数据集概述

来自 kaggle 的数据集,已删除重复数据。

数据字段

数据实例具有以下字段:

  • image:包含图像的PIL.Image.Image对象。请注意,访问图像列时:dataset[0]["image"],图像文件会自动解码。解码大量图像文件可能需要很长时间。因此,在访问“image”列之前,最好先查询样本索引,即dataset[0]["image"]应始终优先于dataset["image"][0]。
  • labels:一个整数分类标签。

类标签映射:

{
  "cat": 0,
  "dog": 1,
}

数据拆分

train test
# of examples 8000 2000
>>> from datasets import load_dataset

>>> dataset = load_dataset("Bingsu/Cat_and_Dog")
>>> dataset
DatasetDict({
    train: Dataset({
        features: ['image', 'labels'],
        num_rows: 8000
    })
    test: Dataset({
        features: ['image', 'labels'],
        num_rows: 2000
    })
})

>>> dataset["train"].features
{'image': Image(decode=True, id=None), 'labels': ClassLabel(num_classes=2, names=['cat', 'dog'], id=None)}