deepset/gelectra-base-germanquad | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

模型:

deepset/gelectra-base-germanquad

任务:

问答

类库:

PyTorch TensorFlow Safetensors Transformers

数据集:

deepset/germanquad 3Adeepset/germanquad

语言:

其他:

electra exbert AutoTrain Compatible

许可:

mit

模型介绍文件清单

英文

概述

语言模型：gelectra-base-germanquad 语言：德语训练数据：GermanQuAD训练集（约12MB）评估数据：GermanQuAD测试集（约5MB）基础设施：1x V100 GPU 发布日期：2021年4月21日

详情

我们使用gelectra-base模型作为基础，训练了一个德语问答模型。
数据集是GermanQuAD，这是一个新的德语语言数据集，我们进行了手工注释和发布 online 。
训练数据集是单向注释的，包含11518个问题和11518个答案，测试数据集是三向注释的，因此有2204个问题和2204·3−76 = 6536个答案，因为我们删除了76个错误答案。

更多详情和数据集以SQuAD格式下载，请参阅 https://deepset.ai/germanquad 。

超参数

batch_size = 24
n_epochs = 2
max_seq_len = 384
learning_rate = 3e-5
lr_schedule = LinearWarmup
embeds_dropout_prob = 0.1

性能

我们对GermanQuAD测试集进行了抽取式问答性能评估。模型类型和训练数据包含在模型名称中。对于XLM-Roberta的微调，我们使用了英文SQuAD v2.0数据集。GELECTRA模型在德语版SQuAD v1.1上进行了预热训练，并在 GermanQuAD 上进行了微调。基准人类模型是使用三向测试集，将一个答案作为预测结果，其他两个答案作为参考答案。