数据集:

rasyidf/coffee-beans

语言:

id

大小:

n<1K

语言创建人:

expert-generated

批注创建人:

expert-generated

源数据集:

original

许可:

mit
英文

咖啡豆数据集卡片

数据集摘要

咖啡豆等级划分

支持的任务和排行榜

  • 图像分类:基于咖啡豆等级划分,此任务的目标是对单个豆子进行聚类等级划分。

语言

印度尼西亚

数据集结构

数据实例

下面提供了训练集的一个样本:

{
    'image_file_path': '/root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg',
    'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x500 at 0x16BAA72A4A8>,
    'labels': 1
}

数据字段

数据实例具有以下字段:

  • image_file_path: 字符串类型,指向图像的文件路径。
  • image: 包含图像的 PIL.Image.Image 对象。请注意,当访问图像列时,dataset[0]["image"] 会自动解码图像文件。解码大量图像文件可能需要相当长的时间。因此,最好先查询样本索引,再查询 "image" 列,即 dataset[0]["image"] 应始终优先于 dataset["image"][0]。
  • labels: 一个整数分类标签。

类标签映射:

{
  "1": 0,
  "2": 1,
  "3": 2,
}

数据拆分

train validation test
# of examples 1400 400 200

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

贡献