数据集:
aharley/rvl_cdip
任务:
图像分类语言:
en计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
extended|iit_cdip预印本库:
arxiv:1502.07058许可:
otherRVL-CDIP(Ryerson视觉实验室复杂文档信息处理)数据集包含16个类别的400,000张灰度图像,每个类别有25,000张图像。其中训练集包含320,000张图像,验证集包含40,000张图像,测试集包含40,000张图像。图像大小使得其最大尺寸不超过1000像素。
所有类别和文档都使用英语作为主要语言。
下面是来自训练集的样本:
{ 'image': <PIL.TiffImagePlugin.TiffImageFile image mode=L size=754x1000 at 0x7F9A5E92CA90>, 'label': 15 }
{ "0": "letter", "1": "form", "2": "email", "3": "handwritten", "4": "advertisement", "5": "scientific report", "6": "scientific publication", "7": "specification", "8": "file folder", "9": "news article", "10": "budget", "11": "invoice", "12": "presentation", "13": "questionnaire", "14": "resume", "15": "memo" }
train | test | validation | |
---|---|---|---|
# of examples | 320000 | 40000 | 40000 |
数据集的拆分比例与ImageNet类似。
引用文献中的原因:
这项工作提供了IIT-CDIP集合的一个新的标记子集,其中包含了16个类别的400,000个文档图像,可用于训练文档分析的新卷积神经网络。
与IIT-CDIP集合中的相同。
数据源语言制作者是谁?与IIT-CDIP集合中的相同。
与IIT-CDIP集合中的相同。
注释者是谁?与IIT-CDIP集合中的相同。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
该数据集由Adam W. Harley、Alex Ufkes和Konstantinos G. Derpanis策划。
RVL-CDIP是IIT-CDIP的一个子集,后者来自 Legacy Tobacco Document Library ,许可信息可以在 here 找到。
@inproceedings{harley2015icdar, title = {Evaluation of Deep Convolutional Nets for Document Image Classification and Retrieval}, author = {Adam W Harley and Alex Ufkes and Konstantinos G Derpanis}, booktitle = {International Conference on Document Analysis and Recognition ({ICDAR})}}, year = {2015} }
感谢 @dnaveenr 添加了该数据集。