数据集:

blinoff/healthcare_facilities_reviews

大小:

10K<n<100K

计算机处理:

monolingual

语言:

ru
英文

数据集摘要

数据集包含对医疗设施的用户评价。

总共包含70,597条评价。按情感级别的分布如下:

  • 41,419条积极评价;
  • 29,178条消极评价。

数据字段

每个样本包含以下字段:

  • review_id ;
  • category 医疗设施的类别(48种之一);
  • title : 评价标题;
  • content : 评价内容;
  • sentiment : 情感(积极或消极);
  • source_url .

Python

import pandas as pd
df = pd.read_json('healthcare_facilities_reviews.jsonl', lines=True)
df.sample(5)