数据集:
wongnai_reviews
任务:
文本分类语言:
th计算机处理:
monolingual大小:
10K<n<100K语言创建人:
found批注创建人:
found源数据集:
original许可:
lgpl-3.0Wongnai Reviews 数据集包含餐厅的评论和评分,几乎全部为泰语。
评论分为5个等级,从1星到5星。
此数据集在 Kaggle 挑战 https://www.kaggle.com/c/wongnai-challenge-review-rating-prediction/overview 中被使用。
泰语
拆分为训练集(40,000 条评论)和测试集(6,204 条评论)。
数据由 Wongnai 从他们网站上的商家评论中收集,并在 GitHub 和 Kaggle 上共享。
评论是用户自己的星级评分,因此不需要额外的注释。
原始 GitHub 仓库的贡献者:
LGPL-3.0
见 https://github.com/wongnai/wongnai-corpus
感谢 @mapmeld , @cstorm125 提供此数据集。