数据集:
times_of_india_news_headlines
许可:
cc0-1.0源数据集:
original批注创建人:
no-annotation语言创建人:
expert-generated大小:
1M<n<10M计算机处理:
monolingual语言:
en这个新闻数据集是一个从2001年初到2020年中印度子大陆的重要事件的持久历史档案,由印度记者实时记录。它包含大约330万个Times of India发布的事件。Times Group作为一个新闻机构,覆盖了亚洲广泛的受众,在每天英文文章的数量上超过了其他机构。由于多年来每天的大量发布,这个数据提供了对印度社会、其优先事项、事件、问题和讨论要点及其随时间发展的深入了解。可以根据一个或多个方面,将这个数据集切分成更小的部分进行更加专注的分析。
[需要更多信息]
数据集中的文本为英文。
{ 'publish_date': '20010530', 'headline_category': city.kolkata, 'headline_text': "Malda fake notes" }
这个数据集没有被分割。
[需要更多信息]
[需要更多信息]
谁是源语言的制作者?[需要更多信息]
[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
数据集由Rohit Kulkarni创建。
数据根据 CC0: Public Domain
@data{DVN/DPQMQH_2020, author = {Kulkarni, Rohit}, publisher = {Harvard Dataverse}, title = {{Times of India News Headlines}}, year = {2020}, version = {V1}, doi = {10.7910/DVN/DPQMQH}, url = {https://doi.org/10.7910/DVN/DPQMQH} }
感谢 @tanmoyio 添加了这个数据集。