数据集:

datacommons_factcheck

子任务:

fact-checking

语言:

en

计算机处理:

monolingual

语言创建人:

found

批注创建人:

expert-generated

源数据集:

original
英文

数据Commons事实核实声明的数据集卡片

数据集摘要

这是一个由 datacommons.org 维护的新闻媒体事实核实声明的数据集,包含声明、作者、判断以及原始事实核查者完整解释的URL。

事实核查由 FactCheck.org PolitiFact The Washington Post 进行。

支持的任务和排行榜

[需要更多信息]

语言

数据使用英语(en)。

数据集结构

数据实例

事实核查实例的示例如下所示:

{'claim_author_name': 'Facebook posts',
 'claim_date': '2019-01-01',
 'claim_text': 'Quotes Michelle Obama as saying, "White folks are what’s wrong with America."',
 'review_date': '2019-01-03',
 'review_rating': 'Pants on Fire',
 'review_url': 'https://www.politifact.com/facebook-fact-checks/statements/2019/jan/03/facebook-posts/did-michelle-obama-once-say-white-folks-are-whats-/',
 'reviewer_name': 'PolitiFact'}

数据字段

数据实例具有以下字段:

  • review_date: 发布事实核查报告的日期。缺失值用空字符串替代
  • review_url: 完整事实核查报告的URL
  • reviewer_name: 事实核查服务的名称。
  • claim_text: 正在审核的声明的完整文本。
  • claim_author_name: 正在审核的声明的作者。缺失值用空字符串替代
  • claim_date: 声明的日期。缺失值用空字符串替代
  • review_rating: 事实核查员的判断(在“alternateName”下,名称因事实核查员而异)

数据划分

未提供划分。总共有5632个经过事实核实的声明。

创建数据集

策划原理

[需要更多信息]

来源数据

初始数据收集和规范化。

[需要更多信息]

谁是源语言生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

事实核查由 FactCheck.org PolitiFact The Washington Post The Weekly Standard 进行。

  • FactCheck.org 自我描述为“无党派,非营利性的选民‘消费者倡导者’,旨在减少美国政治中的欺骗和混淆程度。”它由记者凯瑟琳·霍尔·詹尼森(Kathleen Hall Jamieson)和布鲁克斯·杰克逊(Brooks Jackson)创立,目前由尤金·基利(Eugene Kiely)担任主管。
  • PolitiFact 将其伦理描述为“寻求呈现真实的事实,不受议程或偏见影响,[并且]记者不偏不倚。”该组织由时报华盛顿分社首席记者比尔·阿德尔(Bill Adair)于2007年8月创办。该机构于2018年2月被无盈利的新闻教育和新闻媒体研究中心蓬特研究所收购,该中心还拥有“Tampa Bay Times”报纸。
  • The Washington Post 是一家被认为接近美国政治谱系中心的报纸。2013年,亚马逊公司创始人杰夫·贝佐斯收购了该报纸及其附属出版物。

原始数据源还包含由 The Weekly Standard 审查的132个项目,这是一家新保守派美国报纸。它是该组中政治色彩最浓的来源,最初曾是对事实核查活动的激烈批评者,历史上采取过 close to the American right 的立场。它还不得不承认在公共 libel case 中对一位知名作家的无根指责负有责任。这个来源的经过事实核查的项目可以在weekly_standard配置文件中找到,但应在完全理解此背景的情况下使用。

个人和敏感信息

[需要更多信息]

使用数据时的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

参见上述描述的事实核查组织部分。

[需要更多信息]

其他已知限制

该数据集仅供研究目的使用。请查看数据集许可证以获取更多信息。

其他信息

数据集策划者

这个事实核查数据集由Google发起的 datacommons.org 维护。

许可信息

所有经过事实核实的项目都采用CC-BY-NC-4.0许可发布。

引用信息

Data Commons 2020, Fact Checks, 电子数据集, Data Commons, 查看日期2020年12月16日, https://datacommons.org .

贡献

感谢 @yjernite 添加此数据集。