数据集:

persiannlp/parsinlu_sentiment

语言:

fa

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

expert-generated

批注创建人:

expert-generated

预印本库:

arxiv:2012.06154
英文

数据集卡片:PersiNLU(文本蕴含)

数据集概述

一个波斯语情感分析数据集。

支持的任务和排行榜

[需要更多信息]

语言

该文本数据集使用波斯语(fa)。

数据集结构

数据实例

这是数据集中的一个示例:

{
  "review": "خوب بود ولی خیلی گرون شده دیگه...فک نکنم به این قیمت ارزش خرید داشته باشد",
  "review_id": "1538",
  "example_id": "4",
  "excel_id": "food_194",
  "question": "نظر شما در مورد بسته بندی و نگهداری این حلوا شکری، ارده و کنجد چیست؟",
  "category": "حلوا شکری، ارده و کنجد",
  "aspect": "بسته بندی",
  "label": "-3",
  "guid": "food-dev-r1538-e4"
}

数据字段

  • review : 评论文本。
  • review_id : 与评论相关联的唯一标识符。
  • example_id : 与评论中特定属性相关联的唯一标识符。
  • question : 关于特定属性的自然语言问题。
  • category : 讨论中的主题。
  • aspect : 输入问题中提到的方面。
  • label : 对所提到的方面在特定主题情境中的整体情感。以下是标签的定义:
    '-3': 'no sentiment expressed',
    '-2': 'very negative',
    '-1': 'negative',
    '0': 'neutral',
    '1': 'positive',
    '2': 'very positive',
    '3': 'mixed',

数据拆分

请参见数据。

数据集创建

策划理由

详细信息请查看 the corresponding draft

源数据

初始数据收集和归一化

[需要更多信息]

谁是源语言生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据时的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集维护者

[需要更多信息]

授权信息

CC BY-NC-SA 4.0许可证

引用信息

@article{huggingface:dataset,
    title = {ParsiNLU: A Suite of Language Understanding Challenges for Persian},
    authors = {Khashabi, Daniel and Cohan, Arman and Shakeri, Siamak and Hosseini, Pedram and Pezeshkpour, Pouya and Alikhani, Malihe and Aminnaseri, Moin and Bitaab, Marzieh and Brahman, Faeze and Ghazarian, Sarik and others},
    year={2020}
    journal = {arXiv e-prints},
    eprint = {2012.06154},    
}

贡献者

感谢 @danyaljj 添加了这个数据集。