LayoutLM用于发票
这是一个针对发票和其他文档的问题回答任务的多模态模型的精调版本。它在专有的发票数据集以及通用理解数据集上进行了精调。
非连续标记
与其他问题回答模型不同,其他模型只能提取连续的标记(因为它们预测序列的起始和结束),而这个模型可以通过额外的分类器头预测更长距离、非连续序列。例如,问题回答模型通常会遇到以下失败模式:
之前
之后
然而,这个模型能够预测非连续的标记,因此能够正确预测地址:
开始使用该模型
使用该模型的最佳方式是通过
DocQuery
。
关于我们
这个模型是由
Impira
团队创建的。