数据集:

keremberke/table-extraction

英文

数据集标签

['bordered', 'borderless']

图片数量

{'test': 34, 'train': 238, 'valid': 70}

如何使用

pip install datasets
  • 加载数据集:
from datasets import load_dataset

ds = load_dataset("keremberke/table-extraction", name="full")
example = ds['train'][0]

Roboflow 数据集页面

https://universe.roboflow.com/mohamed-traore-2ekkp/table-extraction-pdf/dataset/2

引用

许可

CC BY 4.0

数据集概述

该数据集于2023年1月18日格林尼治标准时间上午9:41通过 roboflow.com 导出

Roboflow 是一个端到端的计算机视觉平台,可帮助您

  • 与团队共同合作计算机视觉项目
  • 收集和组织图像
  • 理解和搜索非结构化图像数据
  • 注释并创建数据集
  • 导出、训练和部署计算机视觉模型
  • 使用主动学习来改进数据集

您可以使用此数据集的最先进的计算机视觉训练笔记本,请访问 https://github.com/roboflow/notebooks

要查找超过100k的其他数据集和预训练模型,请访问 https://universe.roboflow.com

数据集包括342个图像。数据表以COCO格式进行注释。

对每个图像应用了以下预处理:

  • 自动定向像素数据(使用EXIF定向去除)

没有应用图像增强技术。