数据集:

daekeun-ml/naver-news-summarization-ko

语言:

ko

大小:

10K<n<100K

许可:

apache-2.0
英文

此数据集是作者通过爬取Naver News( https://news.naver.com )来创建的自定义数据集,用于韩国自然语言处理模型的实践。

  • 收集期间:2022年7月1日至2022年7月10日
  • 主题:IT、经济
DatasetDict({
    train: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 22194
    })
    test: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 2740
    })
    validation: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 2466
    })
})

许可证:apache-2.0