AI检测学生作业抄袭行为,准确率达90%
2019年06月07日 由 张江 发表
6182
0
一些研究表明,作业抄袭现象很普遍,在哥本哈根大学计算机科学系,通过人工智能写作分析来检测作业作弊的努力已经进行了几年。现在,根据对13万份丹麦语书面作业的分析,能够以近90%的准确度检测出学生是否独立完成作业。
丹麦高中目前使用Lectio平台来检查学生是否提交了抄袭的作业,这些作业的段落直接抄袭了之前提交的作业。学校很难发现一个学生是否请了别人代他们写作业,这或多或少是通过在线服务系统完成的。
问题是,如果有人被聘请代写任务,Lectio将不会发现它。团队计划通过比较最近提交的写作与学生之前提交的作品来确定写作风格的差异。在其他变量中,该计划着眼于:单词长度,句子结构以及单词的使用方式。例如,“例如”是否写成“ex”或“eg”。
该系统Ghostwriter是围绕机器学习和神经网络构建的。为丹麦高中提供Lectio的公司MaCom已经为1万名不同高中学生提供了13万份书面作业的数据集,可供计算机科学系的Ghostwriter项目研究人员使用。目前,它仍然是一个研究项目。
研究人员Stephan Lorenzen认为这个项目在不久的将来进入高中是可行的,因为学校必须不断加快技术发展,以解决作者身份问题。
训练数据进行测试
Ghostwriter程序使用所谓的连体神经网络来区分两个文本的书写风格。对网络进行大量数据训练,以便从写作风格的表示中学习,然后进行比较。
当学生提交作业时,网络会将其与之前的作业进行比较。对于每个先前的分配,网络提供用于针对新分配书写样式相似性的百分比分数。
最后,这些分数用加权平均值计算,该计算还考虑了其他因素,例如交付时间。最终得分以百分比表示,用来表示新作业与学生写作风格之间的相似性。
应用广泛
Ghostwriter的技术基础可以应用到其他领域。例如,该方案可用于警察工作,对伪造文件分析、法医文件审查员的工作进行补充。
“与警方合作会很有趣,警方目前正在部署法证文件审查员,以寻找他们所比较的文本之间的质量相似性和差异。我们可以查看大量数据并找到模式。我认为这种组合将有益警察工作。”
使用人工智能来检测作弊行为具有广泛的应用。它已被用于分析Twitter推文,以确定它们是由实际用户还是由付费冒名顶替者或机器人编写。