HeNLP/LongHeRo | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

模型:

HeNLP/LongHeRo

任务:

填充掩码

类库:

PyTorch Safetensors Transformers

数据集:

HeNLP/HeDC4 3AHeNLP/HeDC4

语言:

其他:

longformer AutoTrain Compatible

预印本库:

arxiv:2304.11077

模型介绍文件清单

英文

希伯来语长文档语言模型

采用最先进的Longformer语言模型进行希伯来语处理。

如何使用

from transformers import AutoModelForMaskedLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained('HeNLP/LongHeRo')
model = AutoModelForMaskedLM.from_pretrained('HeNLP/LongHeRo')

# Tokenization Example:
# Tokenizing
tokenized_string = tokenizer('שלום לכולם')

# Decoding 
decoded_string = tokenizer.decode(tokenized_string ['input_ids'], skip_special_tokens=True)

引用

如果您在研究中使用了LongHeRo，请引用 HeRo: RoBERTa and Longformer Hebrew Language Models 。

@article{shalumov2023hero,
      title={HeRo: RoBERTa and Longformer Hebrew Language Models}, 
      author={Vitaly Shalumov and Harel Haskey},
      year={2023},
      journal={arXiv:2304.11077},
}

作者:

HeNLP

数据集大小:

1.11 GB