模型:

microsoft/markuplm-large

英文

MarkupLM

多模态(文本+标记语言)的预训练方法,用于 Document AI

简介

MarkupLM 是一种简单但有效的多模态预训练方法,用于视觉丰富的文档理解和信息提取任务,如网页问答和网页信息抽取。MarkupLM 在多个数据集上实现了 SOTA 的结果。更多细节,请参阅我们的论文:

MarkupLM: Pre-training of Text and Markup Language for Visually-rich Document Understanding Junlong Li, Yiheng Xu, Lei Cui, Furu Wei

用法

我们参考了 docs demo notebooks