数据集:
daekeun-ml/naver-news-summarization-ko
此数据集是作者通过爬取Naver News( https://news.naver.com )来创建的自定义数据集,用于韩国自然语言处理模型的实践。
DatasetDict({ train: Dataset({ features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'], num_rows: 22194 }) test: Dataset({ features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'], num_rows: 2740 }) validation: Dataset({ features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'], num_rows: 2466 }) })