模型:

faisalraza/layoutlm-invoices

英文

LayoutLM发票

这是一个用于发票和其他文件问答任务的经过微调的多模型 LayoutLM 模型的版本。它已经在专有的发票数据集以及通用理解的 SQuAD2.0 DocVQA 上进行了微调。

非连续的标记

不同于其他只能提取连续标记的QA模型(因为它们预测序列的开始和结束),这个模型可以通过额外的分类器头来预测更长范围的非连续序列。例如,QA模型经常遇到以下失败模式:

之前

之后

但是这个模型能够预测非连续的标记,因此能够正确预测地址:

开始使用模型

使用这个模型的最佳方式是通过 DocQuery

关于我们

这个模型是由 Impira 团队创建的。