人工智能生成的学术科学写作的识别准确率超过99%
2023年06月08日 由 daydream 发表
39295
0
人工智能聊天机器人ChatGPT的首次亮相引起了全世界的热议,因为它具有大量类似人类的文本和对话的能力。然而,根据6月7日发表在《细胞报告-物理科学》杂志上的一项研究显示,许多迹象可以帮助我们区分人工智能聊天机器人和人类。基于这些迹象,研究人员开发了一种工具,可以识别人工智能生成的学术科学写作,准确率超过99%。
研究论文的第一作者、堪萨斯大学教授Heather Desaire表示:“我们努力创造一种易于理解的方法,这样即使是高中生也可以为不同类型的写作建立一个人工智能探测器。解决AI写作的问题迫在眉睫,人们不需要计算机科学学位就能为这个领域做出贡献。”
“目前,人工智能写作存在一些非常明显的问题,”Desaire说。“最大的问题之一是它汇集了许多来源的文本,并且很难进行准确性检查。这就像‘真假难分’游戏一样。”
尽管许多人工智能文本检测器都可以在线使用,并且性能相当好,但它们并不是专门为学术写作而构建的。为了填补这一空白,该团队旨在构建一种性能更好的工具。他们专注于一种名为“视角”的文章,该文章概述了科学家撰写的具体研究主题。该团队选择了64个视角,并创建了128篇由ChatGPT生成的关于相同研究主题的文章来训练模型。当他们比较这些文章时,他们发现了人工智能写作可预测性的指标。
与AI相反,人类的段落结构更加复杂,句子数量和段落总词数不同,并且句子长度也会波动。标点符号和词汇的偏好也是一个致命点。例如,科学家倾向于使用一些词汇,如"然而",“但是”,"尽管",而ChatGPT在写作中经常使用"其他人","研究人员"等表述。团队总共列出了20个特征供模型寻找。
在测试中,该模型在区分完全由AI生成的文章和人类写作的文章方面达到了100%的准确率。对于识别文章中的单个段落,该模型的准确率达到了92%。在类似测试中,研究团队的模型也远远超出了市场上现有的AI文本检测器。
接下来,研究团队计划确定该模型的适用范围。他们想测试更广泛的数据集以及不同类型的学术科学写作。随着AI聊天机器人的进步和变得更加复杂,研究人员还想知道他们的模型是否可靠。
“当人们听到这项研究时,他们首先想知道的是‘我能用这个来判断我的学生是否真正写了他们的论文吗?’”Desaire说。虽然该模型擅长区分AI和科学家之间的差异,但Desaire表示,它并不是为教育工作者检测由AI生成的学生文章而设计的。但她指出,人们可以很容易地复制他们的方法来为自己的目的建立模型。
来源:https://techxplore.com/news/2023-06-ai-generated-academic-science-accuracy.html