数据集:

Bingsu/Gameplay_Images

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

许可:

cc-by-4.0
英文

游戏玩法图片

来自 kaggle 的数据集。

这是一个包含世界上10款非常著名的电子游戏的数据集。

包括以下游戏:

  • 在我们之中
  • 英勇传说
  • 疯狂堡垒
  • 极限地平线
  • 自由之火
  • 原神
  • 战神
  • 我的世界
  • 罗布乐思
  • 泰拉瑞亚

每个类别有1000个图像,所有图像大小为640 x 360像素。它们的格式是.png。

此数据集是通过从Youtube上著名游戏玩法视频中每隔几秒保存一帧而创建的。

※ 此数据集于2022年1月上传。之后更新的游戏内容不包含在内。

许可证

CC-BY-4.0

数据集结构

数据实例

>>> from datasets import load_dataset

>>> dataset = load_dataset("Bingsu/Gameplay_Images")
DatasetDict({
    train: Dataset({
        features: ['image', 'label'],
        num_rows: 10000
    })
})
>>> dataset["train"].features
{'image': Image(decode=True, id=None),
 'label': ClassLabel(num_classes=10, names=['Among Us', 'Apex Legends', 'Fortnite', 'Forza Horizon', 'Free Fire', 'Genshin Impact', 'God of War', 'Minecraft', 'Roblox', 'Terraria'], id=None)}

数据规模

下载:2.50 GiB 生成:1.68 GiB 总计:4.19 GiB

数据字段

  • image: 图像
    • 一个包含图像的PIL.Image.Image对象。大小=640x360
    • 注意,访问图像列时,dataset[0]["image"]会自动解码图像文件。解码大量图像文件可能需要相当长的时间。因此,在访问"image"列之前,最好先查询样本索引,即总是优先选择dataset[0]["image"]而不是dataset["image"][0]。
  • label: 一个整数分类标签。

类别标签映射:

{
    "Among Us": 0,
    "Apex Legends": 1,
    "Fortnite": 2,
    "Forza Horizon": 3,
    "Free Fire": 4,
    "Genshin Impact": 5,
    "God of War": 6,
    "Minecraft": 7,
    "Roblox": 8,
    "Terraria": 9
}
>>> dataset["train"][0]
{'image': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=640x360>,
 'label': 0}

数据拆分

train
# of data 10000

注意

train_test_split
>>> ds_new = dataset["train"].train_test_split(0.2, seed=42, stratify_by_column="label")
>>> ds_new
DatasetDict({
    train: Dataset({
        features: ['image', 'label'],
        num_rows: 8000
    })
    test: Dataset({
        features: ['image', 'label'],
        num_rows: 2000
    })
})