英文

bert-base-en-zh-cased

我们正在分享能够处理多种语言的较小版本。

distilbert-base-multilingual-cased 不同,我们的版本提供了与原始模型完全相同的表示,从而保留了原始的准确性。

有关更多信息,请访问我们的论文: Load What You Need: Smaller Versions of Multilingual BERT

使用方法

from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("Geotrend/bert-base-en-zh-cased")
model = AutoModel.from_pretrained("Geotrend/bert-base-en-zh-cased")

要生成其他较小版本的多语言转换器,请访问 our Github repo

如何引用

@inproceedings{smallermbert,
  title={Load What You Need: Smaller Versions of Mutlilingual BERT},
  author={Abdaoui, Amine and Pradel, Camille and Sigel, Grégoire},
  booktitle={SustaiNLP / EMNLP},
  year={2020}
}

联系方式

如有任何问题、反馈或需求,请联系 amine@geotrend.fr。