英文

丹麦 BERT(版本2,不区分大小写)由 Certainly (以前称为BotXO)根据 DaNE dataset (Hvingelby等人,2020)的研究进行了命名实体识别微调,作者为Malte Højmark-Bertelsen。

非常感谢 Certainly (以前称为BotXO)进行了丹麦 BERT 的预训练。有关数据和训练细节,请参阅他们的 GitHub repository this article 。您也可以访问他们在Hugging Face上的 organization page

它在TensorFlow和Pytorch格式都可用。可以使用 this link 下载原始的TensorFlow版本。

这是使用 ?Transformers 库在PyTorch中加载丹麦 BERT 进行标记分类的示例:

from transformers import AutoTokenizer, AutoModelForTokenClassification

tokenizer = AutoTokenizer.from_pretrained("Maltehb/danish-bert-botxo-ner-dane")
model = AutoModelForTokenClassification.from_pretrained("Maltehb/danish-bert-botxo-ner-dane")

参考资料

丹麦 BERT. (2020). BotXO. https://github.com/botxo/nordic_bert (原始作品发布于2019年)

Hvingelby, R., Pauli, A. B., Barrett, M., Rosted, C., Lidegaard, L. M., & Søgaard, A. (2020). DaNE:丹麦的命名实体资源。第12届语言资源和评估会议论文集,4597-4604。 https://www.aclweb.org/anthology/2020.lrec-1.565

联系方式

如需帮助或更多信息,请随时联系作者Malte Højmark-Bertelsen,邮箱hjb@kmd.dk,或通过以下平台之一: