笔画节点在手写体汉字识别中的作用*
复杂度,正确率,1前言,2实验1:节点数量效应,1被试,2实验设计,3实验材料,4实验装置及流程,5实验结果,6讨论,3实验2:节点复杂度效应,4实验3:节点复杂度效应的再检验,5总讨论,1节点分析是获得笔画表征的前提,2节
朱一鸣 赵 阳 唐 宁 周吉帆 沈模卫(浙江大学心理与行为科学系, 杭州 310058)
1 前言
汉字是利用二维空间表达信息的象形文字, 由笔画交错连接构成, 其正字法规则(Orthographic regularities)较为复杂(陈天泉, 1983)。虽然当前印刷体汉字识别技术已经成熟, 手写体汉字因其笔画多变、风格各异, 给机器识别带来巨大挑战(任晓倩等, 2018; Krizhevsky et al., 2012)。然而, 汉字使用者往往具备熟练识别手写汉字的能力。因此理解并借鉴人的手写汉字识别机制, 探明笔画、部件等各层次单元的表征及计算机制, 有着重要的理论意义和应用价值(周吉帆 等, 2016; Li et al., 2020; Zhang et al., 2020)。
植根于建构主义的视觉合成分析过程理论(Analysis-by-synthesis process)认为, 所有图像都是由某些因果过程在时间和空间上的执行而产生的,动态生成的结果是一幅静态图像。面对这一输出结果, 人的视觉系统会自发地以概率计算的方式解释图像是如何产生的(Grenander, 1976; Yuille & Kersten,2006)。例如, 人们将苹果公司的标志看作是被“咬了一口”的残缺苹果。面对汉字, 人的视觉系统可能执行了类似的过程: 汉字是笔画和部件按照自上而下、自左向右等正字法规则书写生成的产生式文字,汉字识别可能是根据整字这一静态输出结果, 逆向推理此前的动态书写过程, 猜测输入图像最有可能由哪个原型字书写而成。该产生式的概率推断思想得到行为学和神经科学证据的支持(Gershman et al.,2012; Kok et al., 2013; Laeng et al., 2014)。可见, 如果汉字识别是一个产生式过程, 那么首先需要理解汉字是如何产生的。
汉字是由内含层次关系的各个单元在正字法的引导下生成的。以往的模型大多将汉字分为笔画、部件、整字三层次, 例如经成分模型(Huang &Wang, 1992)、合体汉字识别的相互作用模型(沈模卫, 朱祖祥, 1997)、多层次交互模型(Taft & Zhu,1997)和格式塔认知模型(陈传锋, 黄希庭, 2004)。尽管各模型有所差别, 但它们隐含了一致的观点,即笔画是汉字结构和识别的最小单元。如果汉字识别的过程相当于汉字产生的反向推理, 那么获得笔画表征应当是汉字识别的前提。
支持笔画是汉字识别最小单元的实验证据主要来自汉字的笔画数效应、笔顺效应和笔画独立组块效应 ......
您现在查看是摘要页,全文长 28159 字符。