数据集:

fewshot-goes-multilingual/sk_csfd-movie-reviews

英文

CSFD电影评论数据集卡片(斯洛伐克)

数据集描述

该数据集包含来自捷克/斯洛伐克电影数据库网站 https://csfd.cz 的用户评论。每个评论包含文本、评分、日期以及关于电影(或电视剧)的基本信息。该数据集总共(训练集+验证集+测试集)有30,000条评论。数据是平衡的 - 每个评分的频率大致相同。

数据集特点

每个样本包含:

  • review_id:评论的唯一字符串标识符。
  • rating_str:评分的字符串表示(从"0/5"到"5/5")。
  • rating_int:评分的整数表示(从0到5)。
  • date:发布评论的日期(仅日期,没有时间或时区)。
  • comment_language:评论的语言(始终为"sk")。
  • comment:评论的字符串。
  • item_title:被评论项目的标题。
  • item_year:项目发布的年份(字符串,也可以是一个范围)。
  • item_kind:项目的类型 - 可以是"film"或"seriál"。
  • item_genres:项目的类型列表。
  • item_directors:项目的导演姓名列表。
  • item_screenwriters:项目的编剧姓名列表。
  • item_cast:项目中的演员列表。

数据集来源

数据来源于 https://csfd.cz 网站的数据挖掘和抽样。在使用数据时,请遵守网站运营商的条款和条件。