内隐学习的人工神经网络模型(2)
2.2 人工神经网络模型研究内隐学习的适用性
如上述,人工神经网络的工作原理为通过调整权重逐步学会正确反应。那么,这些基于调整权重来学习正确反应的人工神经网络模型是否适于研究内隐学习呢?内隐学习这一概念强调的是两个特征:第一,它是学习的一种形式;第二,这种学习是内隐的、无需意识努力的。人工神经网络的工作原理极好地匹配了这两个特征。首先,要建立针对某一心理活动的合适的网络模型,必须要经过长期的训练和学习过程,即向模型呈现许多刺激,要求其做出反应,并将模型反应与要求的正确反应进行比较,据此逐步调整内部结构,使模型在以后的刺激情景中,更易做出正确反应。这种学习过程和人类的学习有着惊人的相似,人类在幼年时,虽然脑神经已发展完全,但是他们仍然不能执行各种认知任务,这时候的人脑就好比初始状态的神经网络模型,虽然,已对模型基本结构做了设定(比如,模型由几个加工单元层组成,每层有几个单元,哪些单元和哪些单元间存在联系),但是由于所有的连接权重都是随机设置的,模型不知道刺激与反应间的联系,常常会给出错误反应,而当经过几年的学习之后,人类婴孩不断地从外界接收刺激,做出反应,并接收来自外界的反馈,将之与自己的反应做比较,逐步通过内部结构的改变,来调整自己的行为,从而能够知觉事物、理解言语、控制自身的机体运动,这就好比初始状态的网络模型,能够通过调整权重,达到稳定状态,对刺激模式做出正确反应。可见,人工神经网络模型很好地匹配了内隐学习地第一个特征——两者都是学习过程。其次,内隐学习强调学习是内隐地进行的。由于无法直接探索学习过程是否是内隐的,研究者往往通过验证学习中所获得的知识是内隐的来间接推断学习过程是内隐的,当被试在分类或选择任务中的表现高于随机,却不知道自己是依据何种知识做出正确判断时,习得的知识被认为是内隐的,从而进一步推断学习过程也是内隐的[10~12]。人工神经网络模型也一样,从根据输出结构来调整权重的过程来看,根本无法判断学习过程是否是内隐的,而类似的,人工神经网络的知识表征形式显示神经网络模型所获得的知识很有可能是内隐的。当人工神经网络能做到正确反应时,指导模型该如何反应的知识似乎是存在于单元的组织结构和他们之间的连接权重上,根本无法直接从这种无序而杂乱的结构和权重上看出什么规则,例如:上述判断光条垂直和水平的感知器,我们并无法从直观上判断哪些单元表征垂直光条,哪些单元表征水平光条,这种知识表征形式很有可能是内隐的。这种知识的表征形式被称为分布式表征(distributed representation),它和传统的局部表征(local representation)很不一样,局部表征中,每个用不同的单元表征不同的事物,例如:单元1表征事物1,单元2表征事物2……,在知识提取时,就好比查字典一样,根据不同的事物,找到表征的位置,便可以获悉有关事物的各种知识。而分布表征可以将不同的事物表征在同一组单元中,比如垂直光条和水平光条,在知识提取时,往往只需输入新刺激的内容,比如光条激活了视网膜的哪些区域,便能根据内容找到合适的反应。
, http://www.100md.com
3 广泛应用于内隐学习领域的两种人工神经网络模型
人工神经网络模型很好地匹配内隐学习的两大基本特征。因此,许多研究者针对不同的内隐学习任务,选择不同的人工神经网络模型来拟合内隐学习过程,以探讨内隐学习的本质和机制[13~17]。
纵观近40年来的内隐学习研究,虽然不同的研究者开发了许多不同的任务形式,获得了许多可喜的研究成果,但是这些任务都离不开两种根本的任务形式——人工语法学习和序列学习。相应地,根据两个任务的不同特点,研究者选择了两种不同的模型——自动联系者和简单循环网络(simple recurrent network,简称SRN)——分别对之加以模拟。
3.1 人工语法学习与自动联系者
人工语法学习任务通常是:在学习阶段,要求被试在不知道内在规则的情况下记忆一大堆合法字符串,然后,在测试阶段,向被试呈现一批新的合法和非法字符串,并告知前面学习的字符串是一类符合语法规则的合法字符串,要求被试根据前面的学习,判断新的字符串是否合法[10]。从测试阶段的要求、学习阶段的要求和所学习的知识这三个不同的角度来看,人工语法学习具有三个主要特征:
, 百拇医药
第一,测试阶段要求被试进行的是一项典型的分类任务。相应地,检索1943年以来,人工神经网络模型发展的这段历史,便可以发现只有模式联系者(pattern associator)是专门针对模式识别和分类而开发出来的模型。模式联系者的诞生源自于条件反射的思想,即建立刺激和反应间的联系。用模式联系者的话说,就是对于特定的输入刺激模式,给出相应的反应模式。有趣的是,当用一组单元表示输入模式,另一组单元表示输出模式,它们两两连接在一起(如图2),并使用Hebb法则△Wij=εαiαi更新权重时(其中,ΔWij为输入单元j和输出单元i之间权重的变化量,ε为学习速率,是常数,aWi为输出单元的激活量,aWj为输入单元的激活量),模式联系者便能在同一个模型中存储不同的输入模式,将反应模式相同的输入模式归于同一类,并且当模式中的某些量缺失时,比如某个输入单元损坏,模型仍能正常运行[3]。可见,模式联系者能够有效地模拟分类任务,甚至是某些脑神经受损病人(相当于某些输入或输出单元受损)的分类活动。然而,人工语法学习并不仅是单纯的分类任务,它还具有其他特征,因此,只模拟测试阶段的分类任务是远远不够的。
, http://www.100md.com
第二,人工语法学习的另一个特征是,学习阶段要求被试在没有任何指导(反馈)的情况下学习字符串,即并没有在被试学习某一字符串的同时,告诉他们这一字符串属于哪一类,合法还是非法。投射到模式联系者中,就是在学习对特定刺激模式的分类时,不伴随相应的反应模式,即没有输出单元。事实上,人类的许多学习过程都是在没有外部指导的情况下进行的。比方说,当孩子看到麻雀和燕子(刺激模式)时,家长告诉他这是鸟(反应模式),但很多时候,家长并不在身边,比如,当孩子看到鸽子时,没有外在反应模式指导,孩子仍能反应为鸟,人类似乎能够在没有外在的反应模式引导教育的情况下,学会分类。人工语法学习也是一样,虽然在学习时,没有被告知哪些合法,哪些不合法,但是被试仍能学会分类规则。这些事实提示研究者:必须开发一种没有外在引导者的自适应模型。于是,McClelland 和Rumelhart(1985)在对模式联系者稍做调整的基础上,提出了模式联系者的一个自适应特例——自动联系者[7]。由于没有外部引导,任何自适应模型必须具备自我反馈的功能,自动联系者也一样,如图3所示,每个单元除了接收外部输入(e)以外,还必须接收来自其他单元的内部输入(i),这种存在内部反馈的模型被称为循环模型。为了达到分类的目的,自动联系者旨在再现单元的外部输入模式,就好像人工语法学
图3 含有8个单元的自动联系者(资料来源:文献[7])
习中,记忆字符串一样。而为了达到这一点,必须调节连接权重,使单元的内部输入能匹配外部输入,用公式表示为:
[ 上 页 ] [ 下 页 ], 百拇医药(郭秀艳 朱 磊 魏知超)