数据集:

tyqiangz/multilingual-sentiments

英文

多语言情感数据集

一个收集了分为3类(积极的、中性的、消极的)的多语言情感数据集。

大多数多语言情感数据集要么是2类的积极或消极情感,要么是产品评论的5类评级(如亚马逊的多语言数据集),或者是多种情绪的多类别数据集。然而,对于普通人来说,有时积极、消极和中性这三个类别就足够了,并且更容易理解和标注。此外,简单的积极/消极分类太过简单,实际上世界上大部分文本实际上都是中性的情感。而且,大部分多语言情感数据集都不包括亚洲语言(如马来语、印尼语),而是以西方语言(如英语、德语)为主导。

Git仓库: https://github.com/tyqiangz/multilingual-sentiment-datasets