数据集:
khaclinh/testdata
任务:
目标检测子任务:
face-detection语言:
en计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
expert-generated源数据集:
extended许可:
cc-by-nc-nd-4.0PP4AV 是第一个具有驾驶场景人脸和车牌注释的公开数据集。P4AV 提供了 3,447 张标注的行驶图像,包括人脸和车牌。对于普通相机数据,数据集中的图像来自于安装在移动车辆上的摄像头所拍摄的现有视频。PP4AV 数据集的图像来自于欧洲的 6 个城市,包括各个时间段,包括夜晚。该数据集使用 WoodScape 数据集的鱼眼图像,从前置、后置、左侧和右侧摄像头中选择了 244 张图像作为鱼眼相机数据。PP4AV 数据集可作为自动驾驶系统中数据匿名化模型的基准套件(评估数据集)。
英语
数据点包括图像及其人脸和车牌注释。
{ 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1920x1080 at 0x19FA12186D8>, 'objects': { 'bbox': [ [0 0.230078 0.317081 0.239062 0.331367], [1 0.5017185 0.0306425 0.5185935 0.0410975], [1 0.695078 0.0710145 0.7109375 0.0863355], [1 0.4089065 0.31646 0.414375 0.32764], [0 0.1843745 0.403416 0.201093 0.414182], [0 0.7132 0.3393474 0.717922 0.3514285] ] } }
PP4AV 的目标是构建一个基准数据集,用于评估自动驾驶系统中的人脸和车牌检测模型。对于普通相机数据,我们从现有视频中采样图像,这些视频是安装在移动车辆上,在欧洲城市行驶的。我们重点关注在城市地区采样数据,而不是高速公路,以便提供足够数量的车牌和行人样本。PP4AV 数据集的图像来自于欧洲的 6 个城市,包括各个时间段,包括夜晚。欧洲 6 个城市的源数据如下所述:
我们使用 WoodScape 数据集的鱼眼图像,从前置、后置、左侧和右侧摄像头中选择 244 张图像作为鱼眼相机数据的源数据。鱼眼数据的源文件位于 WoodScape 的 Fisheye images 处。
总共选择了 3,447 张图像,并在 PP4AV 中进行了标注。
标注员对图像中的人脸和车牌对象进行标注。对于人脸对象,边界框包括从前额到下巴再到耳朵处可检测到的所有人脸。人脸以多种尺寸、肤色和被透明材料(如汽车挡风玻璃)部分遮挡的面部进行标注。对于车牌对象,边界框包括具有高度可变性的所有可以识别的车牌,如不同尺寸、国家、车辆类型(摩托车、汽车、公交车、卡车)以及被其他车辆遮挡。车牌的标注是针对行驶车辆的。为确保注释的质量,在注释过程中有两个步骤。第一阶段,两组标注员将独立对相同图像集进行注释。完成其注释输出后,将根据两次注释的边界框之间的 IoU 得分应用合并方法。IoU 得分超过阈值的注释对将被合并并保存为单个注释。IoU 得分低于阈值的注释对将被视为冲突。在第二阶段,两组评审人员将审查冲突的注释对以进行修订,然后再次应用类似于第一阶段的合并方法。这两个阶段的结果将合并形成最终的注释。所有工作都在 CVAT 工具上进行 https://github.com/openvinotoolkit/cvat 。
谁是注释者?Vantix 数据科学团队
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
Linh Trinh
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) 。
@article{PP4AV2022, title = {PP4AV: A benchmarking Dataset for Privacy-preserving Autonomous Driving}, author = {Linh Trinh, Phuong Pham, Hoang Trinh, Nguyen Bach, Dung Nguyen, Giang Nguyen, Huy Nguyen}, booktitle = {IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)}, year = {2023} }
感谢 @khaclinh 添加此数据集。