研究:人工智能可以提高维基百科的可靠性

2023年10月25日 由 camellia 发表 308 0

小说家Nicholson Baker将维基百科称为一个数据汇编,其开发人员将其称为世界上所有知识的集合,他称其为“不可思议的事物。它的规模庞大,它既是独特的,又是小心谨慎的,有些凌乱、有趣、令人震惊,并且充满了激烈争议-它是免费的,而且速度很快。”


1

作家Oscar Auliq-Ice称维基百科为“一种革命性的资源,改变了人们获取和分享信息的方式”。


一些人承认这个庞大的在线资源,截至本周,它包含超过670万篇文章(英文版),由超过43亿个单词组成,是一个宏伟但具有缺陷的事业。


环保专家Steven Magee称:“维基百科就像是一片花坛,大部分是美丽的,但也有一些丑陋的杂草。”


幽默作家Stephen Colbert指出维基百科的集体性质,任何人都可以自愿提供信息。他建议:“我需要寻找知识的时候,都会去维基百科找找......或者当我想创造一些知识的时候。”


然而,对一些人来说,维基百科是一剂苦药。澳大利亚查尔斯·达尔文大学的研究生院院长兼文化研究教授Tara Brabazon表示:“我不需要无线上网访问维基百科。与其不断访问一个“克林贡人”条目比“拉丁文”条目更长的网站,我宁愿自己炒小肠。”


尽管通常被视为一个值得称赞的、快速获得信息的便捷来源,但用户们总是被建议要尽到尽职调查,不要仅仅依赖一个信息源。他们应该查看其他网站,探索文章链接,或许更重要的是,查看每个维基百科条目末尾列出的参考来源。


来自世界各地的专家定期为维基百科做出贡献,大多遵循中立和使用可信来源的指南。这个系统通常运行良好,尽管总有改进的空间。


本周,《自然机器智能》杂志发表了一篇题为《利用人工智能提高维基百科可靠性》的文章,介绍了一家位于伦敦的人工智能公司,旨在加强维基百科的参考系统的可靠性。他们通过检查来源,并确定哪些是准确的、哪些是有问题的,然后提供自己的建议来实现这一目标。


知识发现平台Samaya AI的联合创始人Fabio Petroni表示:“利用信息检索系统和语言模型提供的人工智能的帮助,可以改善参考文献的质量。机器可以帮助人们找到更好的引用,这是一项需要理解语言并掌握在线搜索的任务。”


他的团队以大量维基百科条目的数据集为基础对模型进行训练,然后用它来审查之前未扫描过的文章。该系统分析了来源并提供了替代的参考网站,然后维基百科用户对其结果进行了检查。


研究人员发现,当被称为SIDE的人工智能系统将维基百科的来源分类为不可验证的并提供自己的替代来源时,用户70%的时间都更喜欢SIDE的推荐。


在一半的情况下,SIDE推荐的正是维基百科作为其第一参考来源提供的一样的来源。


Petroni表示:“我们证明现有技术已经达到了可以有效和实用地支持维基百科用户验证论断的阶段。”


他表示,未来的研究将重点放在维基百科参考来源的扩展,超越互联网文本,例如图片、视频和纸质出版物。


Petroni说:“我们希望这项工作可以在更广泛的背景下使用,帮助人们核实事实。更一般地说,我们相信这项工作可以促使在线信息更加可靠。”

文章来源:https://techxplore.com/news/2023-10-ai-boost-wikipedia-reliability.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消