英文

LayoutLM用于文档分类的模型卡片

模型详情

模型描述

这是多模式LayoutLM模型在文档分类任务上的微调版本。

  • 开发者:Impira团队
  • 共享者[可选]:Hugging Face
  • 模型类型:文本分类
  • 语言:英文
  • 许可协议:cc-by-nc-sa-4.0
  • 相关模型:layoutlm
    • 父模型:需要更多信息
  • 更多信息资源:

用途

直接使用

文本分类

下游使用[可选]

需要更多信息

不适用范围

模型不应用于有意制造敌对或疏远人群的环境。

偏见、风险和限制

已经进行了大量研究来探索有关语言模型的偏见和公平性问题(参见,例如, Sheng et al. (2021) Bender et al. (2021) )。该模型生成的预测可能包含针对受保护类别、身份特征和敏感社交和职业群体的令人不安和有害的刻板印象。

推荐

用户(直接和下游用户)应意识到模型的风险、偏见和限制。需要更多信息以提供进一步的建议。

训练详情

训练数据

需要更多信息

训练过程

需要更多信息

预处理

需要更多信息

速度、大小、时间

Num_attention_head: 12Num_hidden_layer:12,Vocab_size: 30522

评估

测试数据、因素和指标

测试数据

需要更多信息

因素

需要更多信息

指标

需要更多信息

结果

需要更多信息

模型检查

需要更多信息

环境影响

可使用 Machine Learning Impact calculator 中介绍的 Lacoste et al. (2019) 来估计碳排放量。

  • 硬件类型:需要更多信息
  • 使用小时数:需要更多信息
  • 云服务提供商:需要更多信息
  • 计算地区:需要更多信息
  • 排放产生的碳量:需要更多信息

技术规格[可选]

模型架构和目标

需要更多信息

计算基础设施

需要更多信息

硬件

需要更多信息

软件

Transformers版本:4.4.0.dev0

引用

BibTeX:

需要更多信息

APA:

需要更多信息

术语表[可选]

需要更多信息

更多信息[可选]

需要更多信息

模型卡片作者[可选]

与Ezi Ozoani和Hugging Face团队合作的Impira团队

模型卡片联系方式

需要更多信息

如何开始使用该模型

使用以下代码开始使用该模型。

Click to expand
from transformers import AutoTokenizer, AutoModelForSequenceClassification
 
tokenizer = AutoTokenizer.from_pretrained("impira/layoutlm-document-classifier")
 
model = AutoModelForSequenceClassification.from_pretrained("impira/layoutlm-document-classifier")