UCSYNLP/MyanBERTa | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

模型:

UCSYNLP/MyanBERTa

任务:

填充掩码

类库:

PyTorch Transformers

数据集:

MyCorpus Web 3AWeb 3AMyCorpus

语言:

其他:

roberta MyanBERTa Myanmar BERT AutoTrain Compatible

许可:

apache-2.0

模型介绍文件清单

英文

模型描述

该模型是基于BERT的缅甸预训练语言模型。MyanBERTa在一个由59,922,99个句子（1.36亿个单词）组成的分词后的缅甸语数据集上进行了528K步的预训练。作为分词器，使用了30522个子词单元的字节级BPE分词器，该分词器在进行了单词分词之后进行了学习。

引用此作品:

Aye Mya Hlaing, Win Pa Pa, "MyanBERTa: A Pre-trained Language Model For
Myanmar", In Proceedings of 2022 International Conference on Communication and Computer Research (ICCR2022), November 2022, Seoul, Republic of Korea

Download Paper

作者:

UCSYNLP

数据集大小:

419.86 MB