数据集:

scaredmeow/shopee-reviews-tl-stars

语言:

tl

大小:

1K<n<10K

数字对象标识符:

10.57967/hf/0656

许可:

mpl-2.0
英文

数据集名称的数据集卡片

数据集概要

此数据集卡片旨在成为新数据集的基本模板。 这是使用 this raw template 生成的。

支持的任务和排行榜

[需要更多信息]

语言

Tagalog (TL)

数据集结构

数据实例

典型的数据点由文本和相应的标签组成。

以下是来自YelpReviewFull测试集的一个示例:

{
    'label': 2,
    'text': 'Madaling masira yung sa may sinisintasan nya. Wala rin syang box. Sana mas ginawa pa na matibay para sana sulit yung pagkakabili'
}

数据字段

  • 'text':评论文本使用双引号(")进行转义,任何内部双引号都使用2个双引号进行转义(")。
  • 'label':对应于评论的分数(介于1和5之间)。

数据拆分

Shopee评论tl 15数据集是通过从1到5的每个评论星级随机选择2100个训练样本和450个样本进行测试和验证构建的。总共有10500个训练样本,以及2250个验证和测试样本。

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和规范化

[需要更多信息]

谁是源语言的制作者?

[需要更多信息]

注解

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

[需要更多信息]