模型:
microsoft/markuplm-base-finetuned-websrc
多模态(文本+标记语言)预训练 Document AI
MarkupLM 是一种简单但有效的多模态预训练方法,用于视觉丰富的文档理解和信息提取任务,如网页问答和网页信息提取。MarkupLM 在多个数据集上取得了最先进的结果。更多详细信息,请参阅我们的论文:
MarkupLM: Pre-training of Text and Markup Language for Visually-rich Document Understanding Junlong Li, Yiheng Xu, Lei Cui, Furu Wei
我们参考 docs 和 demo notebooks 。