数据集:

alkzar90/rock-glacier-dataset

语言:

en

大小:

1K<n<10K

批注创建人:

human-curator

源数据集:

original

许可:

mit
英文

Rock Glacier Detection 数据集卡片

数据集概述

这是一个包含智利安第斯山脉岩石冰川卫星图像的 Rock Glacier Detection 数据集。

支持的任务和排行榜

  • image-classification : 基于卫星图像(来自 sentinel2),该任务的目标是在地理区域中预测岩石冰川的存在与否。
  • image-segmentation : ...

语言

西班牙语

数据集结构

数据实例

以下是图像分类训练集的一个样本:

df = load_dataset("alkzar90/rock-glacier-dataset", name="image-classification")

df["train"][666]

> {'image': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=128x128 at 0x7FB2EC58C6D0>,
 'labels': 0,
 'path': 'train/cordillera/1512.png'
}

以下是图像分割训练集的一个样本:

df = load_dataset("alkzar90/rock-glacier-dataset", name="image-segmentation")

df["train"][666]

> {'image': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=128x128 at 0x7FB2EB7C1160>,
 'masks': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=128x128 at 0x7FB2EC5A08E0>,
 'path': 'train/cordillera/1512.png'}

数据字段

数据实例具有以下字段:

  • image : 一个包含图像的 PIL.Image.Image 对象。注意,访问 image 列时:dataset[0]["image"] 会自动解码图像文件。解码大量图像文件可能需要很长时间。因此,在 "image" 列之前最好先查询样本索引,也就是 dataset[0]["image"] 应始终优于 dataset["image"][0]。
  • labels : 一个整数分类标签。

类标签映射:

{
  "cordillera": 0
  "glaciar": 1,
}

数据拆分

train validation test
# of examples 7875 1125 2700

数据集创建

整理理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

该数据的语言生产者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏差讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集维护者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

@ONLINE {rock-glacier-dataset,
    author="CMM - Glaciares (UChile)",
    title="Rock Glacier Dataset",
    month="October",
    year="2022",
    url="https://github.com/alcazar90/rock-glacier-detection"
}

贡献者

感谢...