数据集:
rotten_tomatoes
任务:
文本分类语言:
en计算机处理:
monolingual大小:
1K<n<10K语言创建人:
crowdsourced批注创建人:
crowdsourced源数据集:
original许可:
license:unknown电影评论数据集。这是一个包含5331个正面和5331个负面处理过的Rotten Tomatoes电影评论句子的数据集。此数据首次用于BoPang和Lillian Lee的论文"Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales.",ACL会议论文,2005年。
'validation'的一个示例如下所示。
{ "label": 1, "text": "Sometimes the days and nights just drag on -- it 's the morning that make me feel alive . And I have one thing to thank for that : pancakes . " }
所有拆分的数据字段都是相同的。
defaultname | train | validation | test |
---|---|---|---|
default | 8530 | 1066 | 1066 |
@InProceedings{Pang+Lee:05a, author = {Bo Pang and Lillian Lee}, title = {Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales}, booktitle = {Proceedings of the ACL}, year = 2005 }
感谢 @thomwolf 、 @jxmorris12 添加此数据集。