这是一个用于处理文档图像上的文本识别的MJSynth数据集,是通过合成生成的,包含了9万个英文单词。数据集包括了训练集、验证集和测试集。数据集的来源为: https://www.robots.ox.ac.uk/~vgg/data/text/
使用数据集流功能可以在不下载整个数据集的情况下快速尝试数据集(参考: https://huggingface.co/docs/datasets/stream )
如果使用了此数据集,请在源网站上提供的引用细节中进行引用
@InProceedings{Jaderberg14c, 作者 = "Max Jaderberg 和 Karen Simonyan 和 Andrea Vedaldi 和 Andrew Zisserman", 标题 = "Synthetic Data and Artificial Neural Networks for Natural Scene Text Recognition", 书名="深度学习研讨会, NIPS", 年份="2014",}
@Article{Jaderberg16, 作者 = "Max Jaderberg 和 Karen Simonyan 和 Andrea Vedaldi 和 Andrew Zisserman", 标题 = "Reading Text in the Wild with Convolutional Neural Networks", 期刊 = "国际计算机视觉杂志", 编号 = "1", 卷 = "116", 页码 = "1--20", 月份 = "一月", 年份="2016",}