AI系统通过眼球运动来识别人类,准确率达到91.53%
2018年09月25日 由 浅浅 发表
117519
0
当我们阅读文本时,我们的眼睛会游走,在一系列称为眼跳的快速运动之间,眼睛平均只会保持固定200-300毫秒。根据波茨坦大学,Weizenbaum网络社会研究所和莱布尼茨农业工程和生物经济研究所的新研究,这些运动受到视觉,注意力,语言和运动控制等认知过程的驱动,而这些足以准确地识别一个人。
团队发表的一篇论文“A Discriminative Model for Identifying Readers and Assessing Text Comprehension from Eye Movements”描述了一种学习将眼动行为(包括扫描路径或注视模式)与个体相关联的系统。
研究人员写道,“在阅读过程中基于眼球运动的识别可能在许多应用领域提供了几个优势,无论如何,用户都可以不受干扰地识别他们会阅读的文件,从而节省时间和注意力。”
首先,该团队确定了可以用眼动追踪系统观察到的扫描路径,它们与文本短语中的“词汇特征”相关(如词频,数字长度,音节和词性)。由此产生的生成模型不仅考虑每个扫视的幅度和持续时间,而且还考虑了五种扫视类型的细微差别,从而推断出给定扫描路径的可能性:
- 将当前单词重新定位在当前位置之前的字符位置
- 将当前单词重新定位在当前位置之后的位置
- 在文本中固定下一个词
- 在下一个单词后将固定移到单词上
- 回归以固定文本中较早出现的单词
该团队使用该模型推导出Fisher内核(一种测量两个对象相似性的函数),可以比较扫描路径。
为了测试系统的准确性,研究人员接下来招募志愿者阅读以随机顺序呈现的11个文本,每个文本都适合单个屏幕。他们的眼球运动用SR Research Eyelink 1000眼动仪记录。
那么AI表现如何呢?在62个读者的测试集中,具有词汇特征的Fisher内核(该团队测试了至少一个没有它们的模型)实现了高达91.53%的识别准确度。这并不像指纹的准确率99.8%那么高,但该团队声称这种方法是最先进的。
研究人员表示,“我们得出的结论是,在某些情况下,这种模型明显优于 Abdelwahab,Kliegl和Landwehr的半参数模型,据我们所知,这是基于眼球运动的最佳公布生物识别模型。”