数据集:
nsmc
任务:
文本分类语言:
ko计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
crowdsourced源数据集:
original许可:
cc-by-2.0[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
每个实例都是由韩国互联网用户在Naver上撰写的电影评论。每行可以拆分为以下字段:
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@InProceedings{Park:2016, title = "Naver Sentiment Movie Corpus", author = "Lucy Park", year = "2016", howpublished = {\\url{https://github.com/e9t/nsmc}} }
感谢 @jaketae 添加此数据集。