数据集:

AigizK/bashkir-russian-parallel-corpora

任务:

翻译

语言:

ba ru

许可:

cc-by-4.0
英文

"bashkir-russian-parallel-corpora"数据集卡片

数据集的组建方式:

  • 寻找两种语言的文本。可以是翻译的书籍或互联网页面(维基百科、新闻网站)
  • 我们的算法尝试将巴什基尔语句与其俄语翻译进行匹配
  • 我们将这些句子对交给人工审核
  • @inproceedings{
    title={Bashkir-Russian parallel corpora},
    author={Iskander Shakirov, Aigiz Kunafin},
    year={2023}
    }