一文读懂眼动追踪技术及应用

一文读懂眼动追踪技术及应用
2019年04月04日 09:59 AI产业链

文章来源:中国民航大学:靳慧斌,刘亚威、人机交互动

很多小伙伴都听说过眼动追踪技术,因为它不仅活跃在虚拟现实/增强现实(VR/AR)这样的科技浪潮中,而且还是人机交互,心理学等领域做学术搞科研的一大利器。

那么眼动追踪到底是怎么回事呢?让本文带你快速读懂眼动追踪技术及应用。本文的文章结构为:

一、什么是眼动追踪?

二、眼动追踪的原理是什么?

三、眼动的常用指标有哪些?

四、如何解读眼动数据?

五、眼动追踪可以应用在哪些领域?

六、总结

什么是眼动追踪?

根据Wiki百科的解释,“眼动追踪技术是指通过测量眼睛的注视点的位置或者眼球相对头部的运动而实现对眼球运动的追踪。”目的是为了监测用户在看特定目标时的眼睛运动和注视方向,过程中需要用到眼动仪和配套软件。

眼动追踪技术是历经了一个长期的发展过程才成熟起来的。目前热门的眼动追踪技术主要是基于眼睛视频分析(VOG,Video oculographic)的“非侵入式”技术,其基本原理是:将一束光线和一台摄像机对准被试者的眼睛,通过光线和后端分析来推断被试者注视的方向,摄像机则记录交互的过程。

眼动追踪的原理是什么?

如果页面上只有一个元素,很简单,用户注意的焦点就是这个元素(如下图):

但事实上,屏幕上元素常常很丰富(如下图),那么眼动追踪技术是如何知道用户都注意了什么呢?

1)你需要了解的人眼的基础知识

目前的眼动仪多采用的是基于瞳孔-角膜反射光斑的识别技术,其所利用的眼动过程保持不变的特征,是眼球角膜外表面上的普尔钦斑(Purkinje image)——眼球角膜上的一个亮光点,由进入瞳孔的光线在角膜外表面上反射(corneal reflection,CR)而产生。

2)眼动仪“推断”被试者视线的原理

以最基本的桌面式眼动仪为例,由于眼动仪(含摄像机)的位置固定,屏幕光源(被试所看的刺激材料)的位置也固定、眼球中心位置不变(假设眼球为球状,且头部不动),普尔钦斑的绝对位置并不随眼球的转动而变化。但其相对于瞳孔和眼球的位置则是在不断变化的——比如,当你盯着摄像头时,普尔钦斑就在你瞳孔之间;而当你抬起头时,普尔钦斑就在你的瞳孔下方。这样一来,只要实时定位眼睛图像上的瞳孔和普尔钦斑的位置,计算出角膜反射向量,便能利用几何模型,估算得到用户的视线方向。再基于前期定标过程(即让用户注视电脑屏幕上特定的点)中所建立的用户眼睛特征与电脑屏幕呈现内容之间的关系,眼动仪就能判断出用户究竟在看屏幕上的什么内容了。

二维的统一眼球图像坐标系与计算机屏幕坐标系的过程如下:

1.首先进行瞳孔的检测,得到瞳孔的坐标

2.进行反射亮斑的位置检测,得到亮斑的坐标

3.根据在屏幕上的注视点的位置(x,y)和瞳孔-角膜反射向量(其起点为瞳孔中心点,终点为反射光斑的中心点,该向量的坐标为(x1,y1))的对应关系进行函数拟合,如经典的也最基本的二次多项式拟合:

x=a+a1*x1+a2*y1+a3*x1*y1+a4*x1^2+a5*y1^2;

y=b+b1*y1+b2*x1+b3*x1*y1+ b4*y1^2+b5*x1^2;

其中,a—a5,b—b5为未知参数。校正定标过程的过程就是求解未知参数的过程,得到这12个参数后即可将瞳孔-角膜反射向量映射为用户在计算机屏幕上的注视点坐标。

总的来说,眼动追踪的核心是图像处理和函数拟合技术,决定了眼动仪的精度和可靠性。对于只是把眼动仪当工具的朋友们来说,了解这些基本OK了。

眼动的常用指标有哪些?

做完一次眼动实验后,我们会得到什么呢?

眼动仪采集的最原始的数据是时间序列,对应的屏幕坐标和瞳孔直径。经配套软件的分析,大致可以得到以下指标:

  • 注视指标:注视时长、注视点数目,注视熵等

  • 扫视指标:扫视频率,扫视幅度,扫视速度等

  • 眨眼指标,瞳孔指标,PERCLOS指标等

同时,软件还能自动生成热点图、视线轨迹图、感兴趣区域等直观的结果。

如何解读眼动数据?

眼睛是心灵的窗户:人所接收到的外界信息有80%来自于眼睛所建立的视觉通道,同时人在进行思维或心理活动时会将其活动过程反映在眼动行为上。可以说,眼动追踪技术是当前科技允许的条件下,“透视”人类思维的最为直观有效的途径。但是有以下几个相关因素还需要我们考虑:

  • 有时候注视不一定会转化为有意识的认知过程(“视而不见”现象)。例如,盯着屏幕发呆,眼动仪依然会判断你在注视某部分的内容,但实际上你此时并没有相关的心理活动。

  • 注视转化的方式可能有所不同,这取决于研究的内容和目的。例如,若是让被试随意浏览某个网站,在网页某个区域注视的次数较多,就可能表明这个人对该区域感兴趣(如某张照片或某个标题),也可能是因为目标区域比较复杂,理解起来比较困难。因此清楚地理解研究目的以及认真仔细地制定测试方案对于眼动追踪结果的阐释很重要。

  • 眼动追踪只是提供了我们“透视”人类思维的方法,但和人的真实想法肯定是有差距的,不可唯眼动数据论,结合其他方法,如“有声思维”,访谈等也是十分重要的。

    眼动追踪可以应用在哪些领域?

1、心理学与神经科学研究(认知心理学研究、神经科学研究、社会心理学研究、视觉感知研究、灵长类和犬类动物研究等)

京都大学-眼动追踪对黑猩猩面孔浏览的研究

大阪大学-使用Tobii Pro眼动仪对自闭症研究

阅读研究

2、用户体验与交互研究(网页可用性、移动端可用性、软件可用性、游戏可用性、视线交互研究)

ATM可用性研究

机场可穿戴式眼动追踪与导向标识系统研究

3、市场研究与消费者调研(购物行为研究、包装设计研究、广告研究)

眼动仪在真实商店环境中的消费者购物决策研究

4、人的效能研究

在人的效能研究领域中,眼动追踪经常被用来进行成功率研究,新手专家对比研究,高效培训方式的开发以及认知策略的评估等。

眼动追踪帮助改善冰球运动击球技巧

5、医学研究与医疗应用

眼动追踪已被越来越多临床研究所采用,主要用于眼病以及大脑和神经障碍的诊断,例如自闭症和帕金森病等。同时眼动追踪技术对于帮助身体残疾人士实现更便捷的沟通也是一项很有未来的技术。

七鑫易维开发的眼控一体机

6、其他研究

如教育学研究,人的疲劳检测,计算机视觉研究等等。

肯尼萨州立大学课堂学生注意力研究

总结

眼动的本质是人注意力资源的主动或被动分配,选择更有用或有吸引力的信息。眼动追踪的核心是图像处理和坐标系的几何映射技术。眼动追踪技术的应用和前景也是很广阔的,大家可以继续挖掘和探究。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部