当前位置: 首页 > 期刊 > 《中国康复医学杂志》 > 2000年第3期
编号:10270845
人工神经网络在肌肉痉挛分类中的应用
http://www.100md.com 《中国康复医学杂志》 2000年第3期
     作者:王广志 张立群 杨福生 丁海曙

    单位:王广志(清华大学电机系生物医学工程专业,北京,100084);张立群(Rehabilitation Institute of Chicago, Chicago 60611, USA);杨福生(清华大学电机系生物医学工程专业,北京,100084);丁海曙(清华大学电机系生物医学工程专业,北京,100084)

    关键词:

    中国康复医学杂志000313 肌肉痉挛(spasticity)是一种伴随着上运动神经损伤,如脊髓损伤、脊髓多节段硬化、中风以及帕金森氏病等出现的一种并发症,其表现主要包括肌张力升高、肌肉僵硬、抽搐性痉挛等。目前对肌肉痉挛的评估尚无好方法,评价标准很不统一,影响了对疾病的准确诊断和疗效判定。在临床和生物医学工程领域,人们一直在探讨对肌肉痉挛程度的客观评价指标和方法,目前常用的评估方法包括:临床分级测评、摆动实验、肌肉反射与腱反射等,其中临床分级测评应用得较广泛。
, 百拇医药
    本研究利用系统辨识方法研究脊髓多节段硬化患者与正常对照组的髌韧带反射特性,在抽取一系列系统特征参数基础上,探讨了利用人工神经网络对测量的系统参数进行分级和评定的方法及效果。

    1 研究目标

    本研究的目标是选择和训练神经网络,根据髌韧带反射特征参数对肌肉痉挛程度进行分级工作,为此需要探讨其可行性和系统性能。我们对神经网络系统提出的初步目标是:①能正确分级,即根据给定的反射特征参数,可以判断与临床评价指标对应的肌肉痉挛病情。②更精确地分级。由于临床指标是基于医生的主观判断而得到,很细的分级是没有意义的。而测试得到的特征参数则相对精确得多,因此有可能利用测试参数得到更精确的分级。③由单次实验辨识参数分级。在测量中存在噪声等不确定因素,因此统计和相关处理都需要多次实验才能得到可靠的测量参数。如果能够利用单次测量(或少数测量)数据进行系统分级,对系统的实用有很大意义。

    2 研究方法
, 百拇医药
    2.1 髌韧带反射特征参数〔1、2〕

    髌韧带反射是一种常见的运动神经反射,也是临床对运动神经控制特性评价的重要指标。当用叩诊锤敲击髌韧带时,绝大多数人会产生反射,表现为股四头肌收缩、膝关节伸展。据悉髌韧带反射特性变化与肌肉痉挛有密切关系,但目前尚无对其定量关系的具体描述。为研究髌韧带反射与肌肉痉挛程度的关系,我们对不同程度脊髓多节段硬化患者(13例)和正常对照组(13例)的髌韧带反射特性进行了测量,利用测量的信号,采用两种系统辨识方法得到了系统的冲击响应函数〔1、2〕。对系统冲击响应函数(impose response function,IRF)曲线,为得到定量的指标,选取了6个特征参数:腱反射增益(Gtr)即系统冲击响应的峰值、反射环路延时(Td)、收缩时间(Tc)、半恢复时间(Thr)、收缩率(Rc)、半恢复率(Rhr)。此外还考虑了测量的系统输出参数,即:力矩峰值(MP)和肌电峰值(EMGP)。通过对上述参数的方差分析和假设检验,证明这些参数对不同样本组具有特异性;通过对比上述测量参数与临床指标的相关程度,证明上述参数与临床指标有较高的相关程度〔1、2〕
, http://www.100md.com
    虽然上述研究表明了利用系统测量参数可以区分不同测试对象组间的显著性差异,测量参数与临床分级指标也有较强的相关关系,但从上述参数尚无法直接得到对痉挛程度的评价。其主要原因包括:①虽然从统计意义上,不同样本组的参数有显著性差异,但具体到每个测试对象,各参数的表现是很复杂的,而且参数间变化是交叉的,无法直接根据参数进行分级;②反射特性参数与肌肉痉挛程度之间尚不具备确定的关系,无法以反射特性参数表示病情的程度;③肌肉痉挛程度的临床评价是通过有经验的医生对患者运动系统的综合描述,利用个别的测量参数很难表示复杂的病情,因此需要探讨利用特征参数对病情进行分类的方法。

    2.2 神经网络及结构的选取

    许多神经网络都可以完成模式识别和模式分类的工作〔3、4〕,例如感知器(perceptrons)、线性神经网络、多层前向网络、自组织特征映射网络等。在本研究工作中我们对多种网络结构和不同的算法进行了试验,对其训练效率、分类性能、泛化能力等方面进行了对比。
, http://www.100md.com
    在研究中系统输入向量具有8个分量,系统的输出为临床分级指标(即Ashworth指标),分为0~4级。为确定这些向量是否线性可分,首先采用了具有多个神经元的单层感知器神经网络进行了试算。结果表明,上述向量不是线性可分的,感知器神经网络无法找到正确的分类方案,因此无法利用超平面将它们分开。由于系统的输入-输出关系比较复杂,无法利用上述简单的网络结构完成其分类问题。因此需要尝试较为复杂的多层网络。在研究中主要考察了两种网络,即多层前向网络(multi layer forward network,MLFN)和自组织特征映射网络(self organized feature mapping,SOFM)类型的神经网络。实践证明,采用“反向传播(back propagation,BP)+竞争”的多层前向网络结构具有比较好的效果。对上述前向网络,也可以利用径向基函数构造网络,由于径向基网络在逼近能力和学习能力方面具有优势,有可能达到较好的性能。

    在处理中考虑到输入向量中的分量值差异很大〔2〕,若对其进行归一化(normalization)处理,可能会收到好的效果。与此同时,对输出向量也可以进行归一化处理。多层前向网络的输出为连续变量,通过训练网络,可以将输入向量映射在一定范围内。根据前面提出的目标,首先要求网络能够正确分类,为此将输出向量经过一个竞争层传递函数,并比较通过竞争层之后的输出向量,判断其分类是否正确。这样网络成为一种“BP+竞争”的结构(图1)。
, http://www.100md.com
    构造上述网络后,可以对网络性能进行考察,通过调整网络结构(神经元数目、类型),优化训练集的选取和预处理,并对网络的推广能力进行试验。在试验中首先要求网络能够满足正确分类的目标,在此基础上再考虑利用网络精确分级和利用单次试验数据分级的问题。

    图1 具有输出竞争层的网络结构

    2.3 训练集与测试集

    髌韧带反射特征参数中可以形成训练集的输入数据包括:①利用相关分析(correlation analysis) 方法辨识系统得到IRF导出的8个特征参数;②利用归一处理,近似得到的每一次敲击对应的系统IRF导出的特征参数(每个测试对象有20~30组);③各次系统响应特征参数的平均值。形成训练集的输出数据为临床医生对受试者的分级评价。这些数据在前面的工作中已经获得〔1、2〕,因此可分别利用如下方法构造训练集:①对每个受试者,利用8个系统辨识的特征参数作为输入,受试者分级作为输出。②利用归一处理方法得到的各敲击响应特征值的平均值为输入,受试者分级作为输出。③在各敲击特征值中选择信号较好的部分特征值为输入,受试者分级作为输出。④在各敲击特征值中随机抽取部分特征值为输入,受试者分级作为输出。为了解网络的泛化能力,采用训练集之外的输入数据作为测试集对网络性能进行了分析。
, 百拇医药
    2.4 网络学习方法

    首先单独利用各训练样本进行网络训练,以便对网络性能和学习算法有一定了解,并在此基础上考虑更复杂的训练方案。前向网络的BP学习算法有很多种,在研究中使用了MatLabTM的人工神经网络工具箱〔5〕,其中提供了多种算法,包括传统的BP算法、BP+惯量算法(动量BP算法)、动量-学习率调整算法、以及建立在优化方法基础上的Levenberg-Marquardt算法等。实践证明,在用BP算法处理离线问题时,动量-学习率调整算法是一种比较好的算法,该算法采用了动量法和学习率自调整两种策略,通过动量(惯性)学习算法,降低了网络对于误差曲面局部细节如小的波谷或平台的敏感性,有效地抑制了迭代过程中陷于局部极小点的问题;通过自适应调整学习率,可以缩短学习时间。上述两种措施的综合运用提高了学习速度和算法的可靠性,见图2,3。

    对于选用的SOFM类型的神经网络,我们将其作为分类器使用,因此采用学习向量量化(learning vector quantization,LVQ)算法进行训练。试验表明其学习效率也是很高的。同时,网络神经元数目的选取对分类性能会有较大的影响。
, 百拇医药
    图2 动量-学习率调整算法的误差下降曲线

    和学习率变化曲线

    2.5 综合训练

    可以选用多组样本数据构造训练集,在试算中发现用特定训练集得到的网络参数对某些测试集的分类效果好,而对另外一些测试集的分类效果则较差, 说明训练可能不能涵盖所有反射模式。因此采用了综合训练的方法,交叉利用不同的训练集对网络进行训练,并利用交叉有效法对网络性能进行评价,收到了比较好的效果,使网络对训练集和测试集的误差都比较小。

    图3 Levenberg-Marquardt算法的误差下降曲线

    3 结果

    通过选择和训练神经网络证明采用神经网络方法,根据髌韧带反射特征参数对肌肉痉挛病情进行分级是可行的,对于利用工程方法进行临床评价有一定意义。
, http://www.100md.com
    3.1 神经网络的分级性能

    试验结果表明,上述几种网络在一定条件下均能够较好地完成正确分级的任务,但各个网络的分级性能有一定差异。采用自组织特征映射(SOFM)类型的神经网络,可以将其直接作为分类器使用,通过LVQ学习算法形成聚类,并利用该网络对输入向量进行分类。通过选取合适的神经元数目,系统可以具有较好的分类性能,但系统参数的选取对性能有较大影响,测试集有时会出现误分的情况,其原因可能是神经网络参数与泛化性能的问题,也可能来自于测试样本,即特征参数指标介于两个分级之间,人工的分级会具有一定误差。在试验中还发现, 选取较多的神经元会使训练误差得到改善, 但系统的泛化能力会相应下降。试验证明,通过选取合适的多层前向网络(MLFN)结构和适当的训练,可以达到较好的分类性能,且网络具有较好的泛化能力,其中性能最好的是图1所示的网络结构。在处理时借鉴了一种对英文字母进行特征识别的网络结构,该网络采用两层sigmoid神经元,并通过一个竞争层传递函数处理输出向量。网络的隐层取5~8个神经元,通过综合训练可以达到较好的分类性能。图4给出了利用该网络进行分类的一个算例,可见所有测试向量均得到了正确分类。因此,“能正确分级”的目标是可以较好地达到的。
, 百拇医药
    图4 一组“BP+竞争”网络的分级结果

    3.2 能否利用神经网络更精确地分级?

    从测试得到的特征参数〔2〕可以看到,一些特征参数的取值范围很大,如与临床分级相关性很大的参数Gtr和Rc,其变化范围均在20倍以上。这提示我们,临床采用的分级是比较粗的,从测试得到的特征参数出发,有可能进行更细致的分级,这对临床评价和对治疗效果的细致跟踪是有意义的。因此可以考虑通过神经网络对测试得到的特征参数进行某种量化映射,得到该特征向量对应的分级指标,并在此基础上对临床问题给出判断。从结果来看,人工神经网络可以在一定程度上达到这样的目的。图5为一组采用多训练集综合训练得到的结果,通过综合训练,网络对训练集和测试样本均有较好的精度,说明训练样本的选取对优化系统误差和提高系统泛化能力都有很大影响。

    可见,通过神经网络可以根据输入的特征参数向量,给出对应的分级指标,且具有一定的精度和较强的泛化能力。因此采用神经网络对特征参数进行较精确的分级是完全可能的。现在存在的问题是由于训练集输出向量的分级不够细致,因此训练的网络在很大程度上将输入向量映射到训练向量对应的级别上,脱离该分级的偏移被视为误差。如果在临床实际中可以通过某种手段得到较为精确的分级,就可以训练出能够更精确处理分级问题的网络。另外一种可行的方法是将上述测试的特征参量作为衡量病情的指标,并通过神经网络得到由这些参量表示的综合指标,通过积累病例,得到这种指标的评价标准,并将其作为对病情进行判断的依据。
, 百拇医药
    图5 采用综合训练的结果

    3.3 能否由单次实验辨识参数分级?

    系统IRF的特征参量是在20~30次的敲击反射数据基础上得到的,因此具有较好的信噪比和较好的特异性。在实际中如果能够利用单次测量(或少数测量)数据进行系统分级是有很大意义的。为考察这一问题,从各敲击辨识的特征值中随机抽取部分特征值为神经网络输入进行了测试。结果表明,在信号较好的情况下,利用单次敲击反射特征参数进行分级是有可能的,试验中对17名测试对象取10次反射较强的数据(共170组测试向量),进行分级试验,其结果偏离目标向量的共有16组,最多偏离目标级别1级。但当随机抽取测试向量时,分级误差显著增加。这表明测试信号的信噪比对分级精度有很大的影响。当测试信号较好时,是有可能利用单次(少数次)实验辨识的特征参数进行分级的。考虑到同一测试对象反射力矩曲线的变化情况,较小的反射力矩曲线得到的特征参数将有较大误差。

    4 讨论
, 百拇医药
    在神经网络的类型和结构的选取方面,对于特定问题尚无指导性理论,而网络结构、神经元数目和神经元类型的选取,直接影响网络的性能。本试验的问题虽然比较简单,但在比较各种网络的性能时,也很难给出明确的结论。

    好的网络性能依赖于好的训练集和合理的评价。在处理问题时由于临床的分级比较粗,因此评价也是采用与临床分级比较的结果。如果能够有更细致的训练样本,相信可以得到更细的分级。另外,在处理问题时可以考虑结合统计处理和假设检验等方法,从概率的角度处理问题的不确定性。

    在本研究中采用了系统冲击响应特征参数作为网络的输入向量,这样使问题比较简单,便于处理。但应当指出,上述特征参数仅仅是作为量化问题的一种手段,并不能描述系统的全部特征。更好的途径可能是根据系统冲击响应函数的波形进行分类处理,这样可以更充分地利用系统的信息。在生物医学信号处理研究中,人们已经将人工神经网络用于对脑电和心电波形的特征提取和分类,并收到一定效果。目前面临的问题是如何建立波形与分级间的联系,即如何得到训练集。一种可能的途径是通过积累病例而达到。在此过程中如果充分利用神经网络处理问题,可能大大加快病例积累的进程。
, http://www.100md.com
    本组处理的病例比较少。积累病例的困难在于, 首先要找到合适的患者, 试验中在采集数据的同时,需要有经验的临床医生对病例的临床指标给出比较准确的评价。

    5 结论

    利用工程手段对肌肉痉挛进行分级评价有可能达到较好的效果。由于肌肉痉挛程度的客观评价对病情的评估与治疗效果的评价等方面有重要意义,因此应着力于开发更为客观、容易操作的评价体系。

    参考文献

    1,Zhang, L. Wang, G. et al.Dynamics of Patellar Tendon Reflex in Spastic Multiple Sclerosis Patients, Proc. 20th Ann. Int. Conf. IEEE EMB Soc., 1998, 20:2313-:2316.

    2,王广志,张立群等.采用髌韧带反射特征参数对肌肉痉挛进行评价.第五届全国康复工程学术报告会论文集,1999.95-100.

    3,Lisboa PGJ. , Neural Networks:Current Applications, New York:Chapman & Hall, 1992. 110-170.4 余英林,李海洲著.神经网络与信号分析.广州:华南理工大学出版社,1996.1-30.5 施阳,李俊等编著.MATLAB语言工具箱实用指南,西安:西北工业大学出版社,1998. 124-156.

    收稿日期:1999-10-05, http://www.100md.com