数据集:
sst
任务:
文本分类语言:
en计算机处理:
monolingual语言创建人:
found批注创建人:
crowdsourced源数据集:
original许可:
license:unknown斯坦福情感树库(Stanford Sentiment Treebank)是第一个拥有完全标记的解析树的语料库,可以完整分析语言中情感的组合效应。
数据集中的文本为英文。
对于默认配置:
{'label': 0.7222200036048889, 'sentence': 'Yet the act is still charming here .', 'tokens': 'Yet|the|act|is|still|charming|here|.', 'tree': '15|13|13|10|9|9|11|12|10|11|12|14|14|15|0'}
对于字典配置:
{'label': 0.7361099720001221, 'phrase': 'still charming'}
对于ptb配置:
{'ptb_tree': '(3 (2 Yet) (3 (2 (2 the) (2 act)) (3 (4 (3 (2 is) (3 (2 still) (4 charming))) (2 here)) (2 .))))'}
完整句子的数据集(包括默认和ptb配置)被拆分为训练集、验证集和测试集。字典配置只有一个拆分,用于参考而非学习。
[需要更多信息]
[需要更多信息]
谁是源语言的生产者?Rotten Tomatoes评论员。
[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{socher-etal-2013-recursive, title = "Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank", author = "Socher, Richard and Perelygin, Alex and Wu, Jean and Chuang, Jason and Manning, Christopher D. and Ng, Andrew and Potts, Christopher", booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing", month = oct, year = "2013", address = "Seattle, Washington, USA", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/D13-1170", pages = "1631--1642", }
感谢 @patpizio 添加了这个数据集。