数据集:
senti_ws
SentiWS(SentimentWortschatz)是一个公开可用的用于情感分析、观点挖掘等德语资源。它列出了在[-1;1]区间内加权的正面和负面极性词汇及其词性标签,以及(如果适用的话)它们的屈折变化形式。当前版本的SentiWS包含大约1,650个正面和1,800个负面词汇,分别总计大约16,000个正面和18,000个负面词形,其中包括它们的屈折变化形式。它不仅包含明确表达情感的形容词和副词,还包含隐含着情感的名词和动词。
情感评分,词性标注
德语
用于词性标注:
{ "word":"Abbau" "pos_tag": 0 }
用于情感评分:
{ "word":"Abbau" "sentiment-score":-0.058 }
SentiWS以UTF8编码的文本形式呈现。用于词性标注:
词性标签有["NN"、"VVINF"、"ADJX"、"ADV"],分别表示["名词"、"动词"、"形容词"、"副词"],正负极性词汇的得分介于[-1,1]之间。
训练集:1,650个负面词汇和1,818个正面词汇
[需要更多信息]
[需要更多信息]
语言的来源是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
创作共用归属性-非商业性使用-相同方式共享3.0国际许可证
@INPROCEEDINGS{remquahey2010,title = {SentiWS -- a Publicly Available German-language Resource for Sentiment Analysis},booktitle = {Proceedings of the 7th International Language Resources and Evaluation (LREC'10)},author = {Remus, R. and Quasthoff, U. and Heyer, G.},year = {2010}}
感谢 @harshalmittal4 添加了这个数据集。