LayoutLM发票
这是一个用于发票和其他文件问答任务的经过微调的多模型
LayoutLM
模型的版本。它已经在专有的发票数据集以及通用理解的
SQuAD2.0
和
DocVQA
上进行了微调。
非连续的标记
不同于其他只能提取连续标记的QA模型(因为它们预测序列的开始和结束),这个模型可以通过额外的分类器头来预测更长范围的非连续序列。例如,QA模型经常遇到以下失败模式:
之前
之后
但是这个模型能够预测非连续的标记,因此能够正确预测地址:
开始使用模型
使用这个模型的最佳方式是通过
DocQuery
。
关于我们
这个模型是由
Impira
团队创建的。