数据集:
blinoff/kinopoisk
Kinopoisk电影评论数据集(TOP250和BOTTOM100排行榜)。
总共包含36,591条评论,时间跨度从2004年7月到2012年11月。
分布如下,根据3点情感评分尺度:
每个样本包含以下字段:
import pandas as pd df = pd.read_json('kinopoisk.jsonl', lines=True) df.sample(5)
@article{blinov2013research, title={Research of lexical approach and machine learning methods for sentiment analysis}, author={Blinov, PD and Klekovkina, Maria and Kotelnikov, Eugeny and Pestov, Oleg}, journal={Computational Linguistics and Intellectual Technologies}, volume={2}, number={12}, pages={48--58}, year={2013} }