数据集:
sst2
任务:
文本分类语言:
en计算机处理:
monolingual大小:
10K<n<100K语言创建人:
found批注创建人:
crowdsourced源数据集:
original许可:
license:unknown斯坦福情感树库是一个包含完全标记的句法树的语料库,可以对语言中情感的组合效应进行全面分析。该语料库基于Pang和Lee(2005年)介绍的数据集,包含11,855个从电影评论中提取的单个句子。它使用斯坦福解析器进行解析,并包含来自这些解析树的215,154个唯一短语,每个短语由3个人类评判员进行注释。
完整句子的二元分类实验(将中性句子丢弃,将负面或稍微负面的句子与稍微正面或正面的句子进行区分)将数据集称为SST-2或SST二进制数据集。
数据集中的文本为英语(en)。
{'idx': 0, 'sentence': 'hide new secretions from the parental units ', 'label': 0}
train | validation | test | |
---|---|---|---|
Number of examples | 67349 | 872 | 1821 |
[需要更多信息]
[需要更多信息]
语言生成者是谁?Tomatometmakorelim
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
未知
@inproceedings{socher-etal-2013-recursive, title = "Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank", author = "Socher, Richard and Perelygin, Alex and Wu, Jean and Chuang, Jason and Manning, Christopher D. and Ng, Andrew and Potts, Christopher", booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing", month = oct, year = "2013", address = "Seattle, Washington, USA", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/D13-1170", pages = "1631--1642", }
感谢 @albertvillanova 添加此数据集。