数据集:
ghomasHudson/vlsp
语言:
en该数据集遵循scientific_papers数据集的方法论,但专门设计用于非常长的文档(>10,000字)。这是通过在arxiv.org上搜索论文来收集的。
该数据集具有两个特征:
摘要
英文
[需要更多信息]
[需要更多信息]
只提供了一个测试集。
[需要更多信息]
[需要更多信息]
源语言生产者是谁?[需要更多信息]
[需要更多信息]
标注者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]