数据集:

bazyl/GTSRB

大小:

10K<n<100K

语言创建人:

found

批注创建人:

crowdsourced

源数据集:

original

许可:

gpl-3.0
英文

GTSRB 数据集卡

数据集摘要

德国交通标志基准数据集是2011年国际联合神经网络会议(IJCNN)的一个多类别、单图片分类挑战赛。我们诚邀相关领域的研究人员参与:比赛旨在允许无需特殊领域知识的参与。我们的基准数据集具有以下特点:

  • 单图片,多分类问题
  • 超过40个类别
  • 总计超过50,000张图片
  • 大型真实数据库

支持的任务和排行榜

Kaggle Original

数据集结构

数据实例

{
  "Width": 31,
  "Height": 31,
  "Roi.X1": 6,
  "Roi.Y1": 6,
  "Roi.X2": 26,
  "Roi.Y2": 26,
  "ClassId": 20,
  "Path": "Train/20/00020_00004_00002.png",
}

数据字段

  • 图片宽度: 图片的宽度
  • 图片高度: 图片的高度
  • Roi.X1: 左上角X坐标
  • Roi.Y1: 左上角Y坐标
  • Roi.X2: 右下角X坐标
  • Roi.Y2: 右下角Y坐标
  • ClassId: 图片的类别
  • 路径: 图片的路径

数据拆分

类别: 42 训练集: 39209 测试集: 12630

数据集创建

策划原因

交通标志识别是一个具有高工业相关性的具有挑战性的现实问题。尽管商业系统已经进入市场并且已经发表了多项关于该主题的研究,但缺乏系统的公正比较不同方法并且综合的基准数据集也不免费提供。

交通标志识别是一个多类别分类问题,其类别频率不平衡。交通标志之间在颜色、形状和是否有象形或文字方面存在着广泛的差异。然而,存在一些类别子集(例如,限速标志),它们之间非常相似。

分类器必须能够处理由于光照变化、部分遮挡、旋转、天气条件等造成的视觉外观的大量变化。

人类能够以接近100%的正确性识别各种现有的道路标志。这不仅适用于提供了上下文和单个交通标志的多个视图的实际驾驶,也适用于从单个图像中进行识别。