当前位置: 首页 > 期刊 > 《百科知识》 > 2012年第13期
编号:12743520
视觉搜索 众里寻他千百度(1)
http://www.100md.com 2012年7月1日 百科知识 2012年第13期
     有这样两项任务,第一项是在图1中找出形状像“Q”的符号 。第二项是在图2中找出形状像“O”的符号 。

    实验结果显示,上面两项任务中我们能更快地从一堆”“O”里找到”“Q”,比在一堆”“Q”里面找”“O”的速度要快。这是因为我们容易看到有的,不容易注意到无的。

    从冰箱中找到牛奶,在办公桌上找到车钥匙,在停车场搜寻到自己的汽车,安检人员通过机器检查旅客的行李物品,医生从病人的X光片中发现些许异常……在这些再平常不过的行为中,隐藏着一个并不平常的秘密——视觉搜索。我们每天都会接触大量的视觉信息,为了避免信息超载,人们往往会优先选择对完成当前任务具有重要作用的视觉信息。人们对视觉信息的选择加工常常表现为视觉搜索活动。视觉搜索活动无处不在,每个人所从事的每一项活动都离不开视觉搜索的参与。

    何为视觉搜索
, http://www.100md.com
    所谓视觉搜索,是指人类和动物根据当前任务的需要,依靠视觉有目的地在情境中进行搜索,以找到某个目标物的过程。

    同很多其他学科发展的历史一样,视觉搜索的确切起源已难以追溯。100多年前,英国著名动物学家爱德华·普尔顿就对与动物捕食相关的视觉搜索活动进行了研究。对于动物来说,视觉搜索尤为重要,因为它们的生存在很大程度上依赖于如何获取食物和避免天敌的侵害,这些活动都有赖于视觉搜索。

    “二战”期间,美国海军希望能够开发出一套行之有效的方法,以便在海上定位敌舰或找到己方失踪人员。他们秘密组织了一批研究人员(主要是数学家)对视觉搜索的规律进行研究;如今,视觉搜索的研究者中,除了数学家(运筹学家)、工效学家和生物学家外,还包括心理学家、视觉科学家和神经科学家等。

    近年来,随着计算机视觉和图像处理技术的发展,科学家们开始尝试将人类的视觉搜索功能赋予机器,并制作完成了一些具有视觉搜索功能的设备,以服务于现实生活。例如,一些高端汽车装配了能够自动探测行人的智能系统,以实现自动驾驶功能。计算机辅助的视觉检测技术,如面孔检测、自动化的食品检测和医学图像检测技术等新兴技术,也已悄然兴起。
, http://www.100md.com
    视觉搜索的高效性

    现实生活中的视觉搜索活动往往是相当高效的。用钥匙打开房门,口渴时随手拿起桌上的茶杯,发动汽车……这些动作的完成,都需要一定的视觉搜索活动;由于搜索活动如此高效,以至于我们几乎意识不到搜索行为的存在。

    不仅简单任务中的视觉搜索如此高效,在一些较复杂任务中的视觉搜索也是相当高效的。例如,当我们要泡一杯茶时,需要先在厨房找到茶杯,然后再搜索到茶叶,找到饮水机,最后将热水倒入已装了茶叶的杯中。对我们来说,这一系列搜索行为几乎是自动完成的,即使是在不太熟悉的环境中,我们也能顺利且迅速地完成上述活动。

    虽然视觉搜索活动对人类来说轻而易举并且十分高效,科学家们也模仿人类的视觉搜索能力发明了一些具有类似功能的设备;但对于今天的科学家和工程师来说,对人类视觉搜索的高效性进行完整模拟仍然面临着诸多挑战。
, http://www.100md.com
    2006年,美国宇航局“星尘号”探测器的返回舱在犹他州沙漠成功着陆,它带回了由飞船上的尘埃采集器成功捕获到的彗星尘埃样本。这是人类首次获取彗星物质和星际尘埃样品,对它的分析研究可能会把人类对彗星以及整个太阳系历史的认识向前推进一大步。科学家将这些尘埃样品进行扫描,总共得到了约35万张数码显微照片。这些尘埃十分微小,直径比一根头发丝还细。辨别搜索任务之艰巨,工作量之大,可想而知。伯克利空间实验室最初打算使用计算机视觉探测来完成这个任务;但事实证明,这是不可能完成的任务:一方面,计算机算法的生成需要有关于图像各成分的所有数据,而这对于第一次接触彗星物质图像的人类来说是不可能达成的;另一方面,图像中不仅仅有彗星尘埃,还包含很多不规则的无关物质,它们极易与彗星尘埃混淆,以致让人难以辨识。为此,美国航空航天局的专家们把这些数码显微照片提供给网络志愿者,以便让他们帮忙来共同寻找这些彗星尘埃。

    视觉搜索为何如此高效

    总的来说,我们主要利用两类信息来实现高效的视觉搜索活动,这两类信息分别为自下而上的信息和自上而下的信息。
, http://www.100md.com
    物体的突然出现或消失,或者具有鲜艳的颜色等独特之处,或者处于运动状态等,这些都属于自下而上的信息。人们在没有明确任务的前提下,场景中具有这些信息的物体容易被最先搜索到。例如,当我们在教室上课时,突然从窗外飞进来的一只小鸟,就极易被我们发现;同样,我们也能轻易地从人群中搜索到手拿一束红玫瑰的人,能够很容易地从停车场中搜索到行驶的车辆。许多商店会在门口等显眼的地方安装电子滚动屏幕,也是为了吸引潜在的消费者。

    自上而下的信息主要包括场景的情境提示以及我们头脑中的知识经验等。

    生活经验使我们非常熟知各物体之间的空间位置关系。例如,茶杯放在厨房的橱柜里,茶叶放在桌子上或抽屉里,饮水机放在某个靠墙的位置,等等。与此同时,我们也知道哪些物体往往会共同存在。例如,茶杯和茶壶常常一起出现,刀叉和盘子往往被放在一起,笔和书本往往出现在一起,等等。因此,当需要某件物品时,我们通常能够非常迅速地从复杂场景中找到它。这种由于熟悉场景布局而产生的对视觉搜索的促进作用,在心理学上被称为情境提示效应。
, 百拇医药
    在真实场景中,情境提示效应对我们的视觉搜索具有重要作用。根据情境提示效应所利用信息的类型,人们将情境提示效应分为空间情境提示效应、客体情境提示效应和时间情境提示效应。

    当我们在书房中寻找一支笔时,首先会去书桌上找,而不是去地上或书桌下寻找。这是因为,日常生活经验告诉我们,笔往往会出现在书桌上,而很少出现在地上或书桌下。这种由于各物品摆放的空间位置反复呈现,从而产生对我们搜索速度的促进作用,被称为空间情境提示效应。在日常生活中,我们经常会利用物体间的这种空间关系服务于我们的视觉搜索活动。

    类似地,当我们搜索鼠标时,一般会先从场景中搜索电脑,因为电脑相比鼠标,体积更大更容易被看到,而且电脑往往会和鼠标一起出现,只要找到电脑,一般来说,在它周围就能发现鼠标。这就是客体情境提示效应。, 百拇医药(赵斐斐 任衍具)
1 2下一页