模型:
impira/layoutlm-invoices
这是一个在发票和其他文档上进行问题回答任务的多模态 fine-tuned 模型的版本。它在专有的发票数据集以及 SQuAD2.0 和 DocVQA 用于一般理解方面进行了fine-tuned。
与其他QA模型不同,其他QA模型只能提取连续的tokens(因为它们预测序列的开始和结束),而这个模型可以通过一个额外的分类器头来预测更长范围的非连续序列。例如,QA模型通常遇到以下失败模式:
然而,这个模型可以预测非连续的tokens,因此能正确预测地址:
使用该模型的最佳方式是通过 DocQuery 。
该模型是由 Impira 团队创建的。