数据集:

onestop_english

语言:

en

计算机处理:

monolingual

大小:

n<1K

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

OneStopEnglish语料库数据卡

数据集概述

OneStopEnglish是一个包含三个阅读级别的文本语料库,展示了它在自动可读性评估和自动文本简化两个应用方面的实用性。

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

实例示例:

{
  "text": "When you see the word Amazon, what’s the first thing you think...",
  "label": 0
}

请注意,每个实例包含完整的文档文本。

数据字段

  • text: 文档的完整文本。
  • label: 文档的阅读级别 - 初/中/高(Elementary/Intermediate/Advance)。

数据拆分

OneStopEnglish数据集只有一个训练集拆分。

Split Number of instances
train 567

数据集创建

策展理由

[需要更多信息]

来源数据

初始数据收集和规范化

[需要更多信息]

谁是源语言生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策展人

[需要更多信息]

许可信息

Creative Commons Attribution-ShareAlike 4.0国际许可证

引用信息

[需要更多信息]

贡献

感谢 @purvimisal 添加此数据集。