数据集:

Someman/hindi-summarization

语言:

hi

大小:

10K<n<100K

许可:

mit
英文

数据集卡片 - 数据集名称

数据集摘要

《印地语文本短篇和大篇摘要语料库》是从印地语新闻网站收集的约18万篇文章及其标题和摘要的集合。

这是印地语中第一个可以用于基准测试文本摘要模型的数据集。该数据集与《印地语文本短篇摘要语料库》同时发布,两者不包含相同的文章。

数据集保留了文章中的原始标点符号、数字等。

语言

语言为印地语。

许可信息

MIT

引用信息

https://www.kaggle.com/datasets/disisbig/hindi-text-short-and-large-summarization-corpus?select=test.csv

贡献