数据集:

rasyidf/coffee-beans

任务:

图像分类

子任务:

multi-class-image-classification

语言:

大小:

n<1K

语言创建人:

expert-generated

批注创建人:

expert-generated

源数据集:

original

许可:

mit

数据集介绍文件清单

英文

咖啡豆数据集卡片

数据集摘要

咖啡豆等级划分

支持的任务和排行榜

图像分类：基于咖啡豆等级划分，此任务的目标是对单个豆子进行聚类等级划分。

语言

印度尼西亚

数据集结构

数据实例

下面提供了训练集的一个样本：

{
    'image_file_path': '/root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg',
    'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x500 at 0x16BAA72A4A8>,
    'labels': 1
}

数据字段

数据实例具有以下字段：

image_file_path: 字符串类型，指向图像的文件路径。
image: 包含图像的 PIL.Image.Image 对象。请注意，当访问图像列时，dataset[0]["image"] 会自动解码图像文件。解码大量图像文件可能需要相当长的时间。因此，最好先查询样本索引，再查询 "image" 列，即 dataset[0]["image"] 应始终优先于 dataset["image"][0]。
labels: 一个整数分类标签。

类标签映射：

{
  "1": 0,
  "2": 1,
  "3": 2,
}

数据拆分

train	validation	test
# of examples	1400	400	200

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

谁是源语言的生产者？

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者？

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

贡献

作者:

rasyidf

数据集大小:

275.43 MB