数据集:

myanmar_news

语言:

my

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

found

源数据集:

original

许可:

gpl-3.0
英文

Myanmar_News 数据集卡片

数据集概述

Myanmar_News 数据集包含四个类别的文章摘要:商业、娱乐、政治和体育。

这些数据集是由Aye Hninn Khine在2017年10月收集的

语言

缅甸/缅甸语

数据集结构

数据字段

  • text - 文章的文本内容
  • category - 一个主题:商业、娱乐、政治或体育(请注意拼写)

数据集划分

一个训练集(共8,116行)

数据来源

初始数据收集和规范化

数据由Aye Hninn Khine收集,并在GitHub上以GPL-3.0许可证共享。

多个文本文件由Nick Doiron合并为一个带有标签的CSV文件。

其他信息

数据集维护者

原GitHub仓库的贡献者:

许可信息

GPL-3.0

引用信息

参见 https://github.com/ayehninnkhine/MyanmarNewsClassificationSystem

贡献

感谢 @mapmeld 添加这个数据集。