眼动追踪技术与婴幼儿研究:程序、方法与数据分析(3)
眼动数据的质量一般通过时间分辨率(tempo-ral resolution)和空间分辨率(spatial resolution)(Morgante et al.,2012)两个方面来衡量。时间分辨率主要依赖于眼动仪配备的高速摄像机和软件的数学算法。婴幼儿认知研究中可接受的时间采样率在50-120Hz(Aslin,2012)。目前国内常见的眼动仪,头戴式一般30-120Hz(如:Tobii T120为60或120Hz,ASL H6-HS为360Hz);桌面式一般为60-2000Hz不等。大部分眼动仪时间采样率都能够达到这个标准,研究者有很大的选择空间。但是,由于眼动仪的算法和数据生成方式的差别,研究者如果需要比较精确的时间分辨率(如:婴儿的预测性注视),可能就需要特别关注眼动仪在刺激呈现和数据记录过程中的时钟同步和时间准确性问题(Aslin,2012;Oakes,2012;Wass et al.,2014),这个问题后面会较详细地论述。
空间分辨率不仅依赖于眼动仪的硬件系统,更依赖于校准的质量。一般校准点越多,其空间分辨率越高。如果校准质量较差,基于视频技术的眼动仪(video-based eye tracker)会导致注视叠加出现偏移,从而产生较低空间分辨率和较大噪音的实验数据(Aslin,2012)。比如:研究发现5点校准情况下婴儿注视的空间偏移可达1,2度,远超出说明书所标注的0.95度(Morgante et al.,2012)。建议在条件允许的情况下,使用多点校准(较好的校准为5点及以上)。根据Gredeback等人(2010)研究经验,4月以上婴儿一般可以完成5点或6点校准,小于4个月的婴儿一般采用2点校准。目前研究中普遍存在的一个问题是只报告眼动的时间分辨率,而忽视了空间分辨率。检索目前婴幼儿研究可以发现,很少有研究报告仪器的空间分辨率。国内常用眼动仪中,高时间分辨率眼动仪的空间分辨率一般为0.01-0.03度(如:EveLink 1000/2000。SMI Hi-speed/RED),而一些针对幼儿或头戴式眼动仪,空间分辨率一般为0.5度左右(如:Tobii T12ffT60 XL,SMI ETG,ASL Mobile Eye,ASL H6/D6)。
此外,大部分婴幼儿研究都存在头动的问题。研究发现婴幼儿在实验中头动与眼动数据质量呈现负相关,但是这种影响仅限于数据稳定性而不影响准确性(Wass et al.,2014)。目前大部分眼动仪都标注了头动范围(如:Tobii允许30×22×30cm(长、宽、深)范围内头动,SMI标注40x20×70cm),但是也有一些眼动仪没有在手册或说明书中详细标注可以允许头动范围。虽然大部分遥测眼动仪都宣称可以允许一定范围的头动,但是头动问题仍然会降低数据质量(见图1)。对于年龄较大的幼儿而言,有效的办法是使用托架:对于年龄较小的婴儿则尽量由父母来控制头动。
很多仪器在刺激呈现和数据记录上都存在延时现象,这种延时更多来自刺激与记录时钟不同步或被试头动导致的追踪失败恢复延时(Aslin。2012)。一般而言,追踪失败后延时、刺激呈现与记录同步性是衡量眼动追踪技术的重要参数指标。Mor-gante、Zolfaghari和Johnson(2012)对比了TobiiT60XL眼动仪记录的POG(position of'gaze)数据和Tobii Studio生成的数据,发现两者之间的延时最高可达55ms(M=44.5ms,range=27-54.5ms)。当使用E-prime呈现刺激同时使用Tobii Studio记录数据,仍然发现E-prime记录的注视数据和TobiiStudio导出的数据之间存在不一致性。此外,Shukla等人(2011)采用基于Matlab数据采集发现,超过95%的眼动数据都存在大约lOOms的不一致性。由于技术障碍、刺激材料复杂性和被试的个体差异。延时的问题目前还要靠研究者自己权衡和取舍(Aslin,2012)。
除了以上因素,一些其他因素也会降低眼动数据质量。比如:婴儿的个体差异性;实验前有哭泣,眼泪或水汪汪的眼睛会影响角膜反光记录:婴幼儿在实验过程中分心,不能集中注意力参与实验;较长的测验时间导致被试疲劳等。另外,相对于成人的瞳孔比例,婴幼儿瞳孔比例偏大,导致以成人为标准设计的眼动仪对婴儿校准时遇到困难,从而影响注视追踪和数据质量(Wass et al.,2014)。
因此,从影响眼动数据质量的因素上考虑,研究者可从以下方面保证婴幼儿的眼动数据质量:①尽量选择50-120Hz甚至更高采样率的眼动仪,以保证良好的时间分辨率。②条件允许情况下,可采用5点及以上校准点数,以保证良好的空间分辨率。③减少婴幼儿被试的头动,年龄稍大的幼儿可借助托架记录眼动数据,年龄较少的婴幼儿可由父母协助控制其头动。④实验前确保婴幼儿眼睛内无较多(因哭泣、呵欠而致的)眼泪。⑤实验中尽量减少与实验无关的分心刺激的干扰。⑥尽量缩短单个block的实验时间及实验总时长等。
3.2 如何插补、过滤和筛选婴幼儿眼动数据
针对婴幼儿研究的眼动数据质量偏低的现象,研究者关心如何采用补偿的方式或数据算法来保证数据的真实性。在婴幼儿研究中,头动后如何及时恢复追踪且处理因为追踪丢失导致的延时是特别棘手的问题(Oakes,2012;Wass et al.,2014)。允许头动的眼动仪都会使用插补(interpolation/mapping)的方式把由于头动而没有追踪到的数据基于数学算法填补进来(插补算法可参照:Duchowski。2007)。但是,大部分眼动仪都没有详细介绍头动后眼动数据的插补算法(可能涉及到知识产权或保密性问题)。建议研究者在选择眼动仪或进行实验时,根据研究目的和被试特点详细咨询和评估头动的插补算法。对于缺失数据插补,也很少有研究报告。Wass等人(2014)在研究中对数据插补进行了设定。如果数据丢失小于150ms,使用线性插补来弥补丢失数据,大于150ms不进行插补。也有研究者(Franket al.,2012)对单眼缺失的数据进行了插补以保证数据完整性;同时,采用双侧过滤算法(bilateralfiltering algorithm)对数据进行了平滑处理(Durand&Dorsey,2002,Frank et al.,2009)。 (王福兴 童钰 钱莹莹 谢和平)
空间分辨率不仅依赖于眼动仪的硬件系统,更依赖于校准的质量。一般校准点越多,其空间分辨率越高。如果校准质量较差,基于视频技术的眼动仪(video-based eye tracker)会导致注视叠加出现偏移,从而产生较低空间分辨率和较大噪音的实验数据(Aslin,2012)。比如:研究发现5点校准情况下婴儿注视的空间偏移可达1,2度,远超出说明书所标注的0.95度(Morgante et al.,2012)。建议在条件允许的情况下,使用多点校准(较好的校准为5点及以上)。根据Gredeback等人(2010)研究经验,4月以上婴儿一般可以完成5点或6点校准,小于4个月的婴儿一般采用2点校准。目前研究中普遍存在的一个问题是只报告眼动的时间分辨率,而忽视了空间分辨率。检索目前婴幼儿研究可以发现,很少有研究报告仪器的空间分辨率。国内常用眼动仪中,高时间分辨率眼动仪的空间分辨率一般为0.01-0.03度(如:EveLink 1000/2000。SMI Hi-speed/RED),而一些针对幼儿或头戴式眼动仪,空间分辨率一般为0.5度左右(如:Tobii T12ffT60 XL,SMI ETG,ASL Mobile Eye,ASL H6/D6)。
此外,大部分婴幼儿研究都存在头动的问题。研究发现婴幼儿在实验中头动与眼动数据质量呈现负相关,但是这种影响仅限于数据稳定性而不影响准确性(Wass et al.,2014)。目前大部分眼动仪都标注了头动范围(如:Tobii允许30×22×30cm(长、宽、深)范围内头动,SMI标注40x20×70cm),但是也有一些眼动仪没有在手册或说明书中详细标注可以允许头动范围。虽然大部分遥测眼动仪都宣称可以允许一定范围的头动,但是头动问题仍然会降低数据质量(见图1)。对于年龄较大的幼儿而言,有效的办法是使用托架:对于年龄较小的婴儿则尽量由父母来控制头动。
很多仪器在刺激呈现和数据记录上都存在延时现象,这种延时更多来自刺激与记录时钟不同步或被试头动导致的追踪失败恢复延时(Aslin。2012)。一般而言,追踪失败后延时、刺激呈现与记录同步性是衡量眼动追踪技术的重要参数指标。Mor-gante、Zolfaghari和Johnson(2012)对比了TobiiT60XL眼动仪记录的POG(position of'gaze)数据和Tobii Studio生成的数据,发现两者之间的延时最高可达55ms(M=44.5ms,range=27-54.5ms)。当使用E-prime呈现刺激同时使用Tobii Studio记录数据,仍然发现E-prime记录的注视数据和TobiiStudio导出的数据之间存在不一致性。此外,Shukla等人(2011)采用基于Matlab数据采集发现,超过95%的眼动数据都存在大约lOOms的不一致性。由于技术障碍、刺激材料复杂性和被试的个体差异。延时的问题目前还要靠研究者自己权衡和取舍(Aslin,2012)。
除了以上因素,一些其他因素也会降低眼动数据质量。比如:婴儿的个体差异性;实验前有哭泣,眼泪或水汪汪的眼睛会影响角膜反光记录:婴幼儿在实验过程中分心,不能集中注意力参与实验;较长的测验时间导致被试疲劳等。另外,相对于成人的瞳孔比例,婴幼儿瞳孔比例偏大,导致以成人为标准设计的眼动仪对婴儿校准时遇到困难,从而影响注视追踪和数据质量(Wass et al.,2014)。
因此,从影响眼动数据质量的因素上考虑,研究者可从以下方面保证婴幼儿的眼动数据质量:①尽量选择50-120Hz甚至更高采样率的眼动仪,以保证良好的时间分辨率。②条件允许情况下,可采用5点及以上校准点数,以保证良好的空间分辨率。③减少婴幼儿被试的头动,年龄稍大的幼儿可借助托架记录眼动数据,年龄较少的婴幼儿可由父母协助控制其头动。④实验前确保婴幼儿眼睛内无较多(因哭泣、呵欠而致的)眼泪。⑤实验中尽量减少与实验无关的分心刺激的干扰。⑥尽量缩短单个block的实验时间及实验总时长等。
3.2 如何插补、过滤和筛选婴幼儿眼动数据
针对婴幼儿研究的眼动数据质量偏低的现象,研究者关心如何采用补偿的方式或数据算法来保证数据的真实性。在婴幼儿研究中,头动后如何及时恢复追踪且处理因为追踪丢失导致的延时是特别棘手的问题(Oakes,2012;Wass et al.,2014)。允许头动的眼动仪都会使用插补(interpolation/mapping)的方式把由于头动而没有追踪到的数据基于数学算法填补进来(插补算法可参照:Duchowski。2007)。但是,大部分眼动仪都没有详细介绍头动后眼动数据的插补算法(可能涉及到知识产权或保密性问题)。建议研究者在选择眼动仪或进行实验时,根据研究目的和被试特点详细咨询和评估头动的插补算法。对于缺失数据插补,也很少有研究报告。Wass等人(2014)在研究中对数据插补进行了设定。如果数据丢失小于150ms,使用线性插补来弥补丢失数据,大于150ms不进行插补。也有研究者(Franket al.,2012)对单眼缺失的数据进行了插补以保证数据完整性;同时,采用双侧过滤算法(bilateralfiltering algorithm)对数据进行了平滑处理(Durand&Dorsey,2002,Frank et al.,2009)。 (王福兴 童钰 钱莹莹 谢和平)