l3cube-pune/telugu-bert-scratch | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

模型:

l3cube-pune/telugu-bert-scratch

任务:

填充掩码

类库:

PyTorch Transformers

语言:

其他:

bert AutoTrain Compatible

预印本库:

arxiv:2211.11418

许可:

cc-by-4.0

模型介绍文件清单

英文

TeluguBERT-Scratch

TeluguBERT是一个从头开始训练的泰卢固语BERT模型，使用公开可用的泰卢固语单语数据集进行训练。

有关数据集、模型和基准结果的初步详细信息可以在我们的[ paper ]中找到。

引用：

@article{joshi2022l3cubehind,
  title={L3Cube-HindBERT and DevBERT: Pre-Trained BERT Transformer models for Devanagari based Hindi and Marathi Languages},
  author={Joshi, Raviraj},
  journal={arXiv preprint arXiv:2211.11418},
  year={2022}
}

以下是其他从头开始训练的模型的列表： Marathi-Scratch Marathi-Tweets-Scratch Hindi-Scratch Dev-Scratch Kannada-Scratch Telugu-Scratch Malayalam-Scratch Gujarati-Scratch

下面是更好的单语Indic BERT模型的版本列表： Marathi BERT Marathi RoBERTa Marathi AlBERT

Hindi BERT Hindi RoBERTa Hindi AlBERT

Dev BERT Dev RoBERTa Dev AlBERT

Kannada BERT Telugu BERT Malayalam BERT Tamil BERT Gujarati BERT Oriya BERT Bengali BERT Punjabi BERT

作者:

L3Cube

数据集大小:

483.62 MB