数据集:

ghomasHudson/vlsp

语言:

en
英文

vlsp数据集的数据卡片

数据集摘要

该数据集遵循scientific_papers数据集的方法论,但专门设计用于非常长的文档(>10,000字)。这是通过在arxiv.org上搜索论文来收集的。

该数据集具有两个特征:

  • 文章:文件主体。
  • 摘要:文件的摘要。

支持的任务和排行榜

摘要

语言

英文

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

只提供了一个测试集。

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

源语言生产者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

标注者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]