模型:

magorshunov/layoutlm-invoices

英文

LayoutLM用于发票

这是一个针对发票和其他文档的问题回答任务的多模态模型的精调版本。它在专有的发票数据集以及通用理解数据集上进行了精调。

非连续标记

与其他问题回答模型不同,其他模型只能提取连续的标记(因为它们预测序列的起始和结束),而这个模型可以通过额外的分类器头预测更长距离、非连续序列。例如,问题回答模型通常会遇到以下失败模式:

之前

之后

然而,这个模型能够预测非连续的标记,因此能够正确预测地址:

开始使用该模型

使用该模型的最佳方式是通过 DocQuery

关于我们

这个模型是由 Impira 团队创建的。