当前位置: 首页 > 期刊 > 《分析化学》 > 2006年第8期
编号:11155466
用于紫外光谱水质分析的Boosting偏最小二乘法
http://www.100md.com 《分析化学》 2006年第8期
水质分析,紫外光谱,总有机碳,Boosting偏最小二乘,,水质分析,紫外光谱,总有机碳,Boosting偏最小二乘,1引言,2分析过程
     摘要 为提高水质参数总有机碳(TOC)的紫外吸收光谱分析的预测精度,提出一种基于Boosting理论的迭代式回归建模算法,并根据统计学习理论提出一种新的迭代停止判据,可有效防止过拟合,显著提高模型预测精度。为评估所提算法的性能,分别采用本算法和3种常用的光谱分析方法,即偏最小二乘、主成分回归和人工神经网络,对自行研制的紫外光谱水质分析仪实测的一组数据进行了建模和预测。计算结果表明:相对于其他3种方法,本算法具有生成的模型预测精度高的显著优势。

    关键词 水质分析,紫外光谱,总有机碳,Boosting偏最小二乘

     1 引言

    紫外光谱水质分析方法是通过建立紫外光谱数据与水质参数之间的数学模型,并在此模型基础上,根据新水样的紫外光谱数据预测其相应的水质参数。该方法具有分析速度快、无污染、重复性好、维护量少等优点,近年来在环境监测领域得到大力研究与开发 [1~3]。由于其分析精度主要取决于所建光谱模型的预测性能[3],目前提高紫外光谱水质模型的预测精度已成为该方法的研究重点。

    紫外光谱水质分析常用的建模方法有偏最小二乘(PLS)[1]、主成分回归(PCR)和人工神经网络(ANN)[2]等。其中PLS和PCR因能显著压缩高维数据和有效去除共线性,在光谱分析中得到广泛应用。但采用PLS和PCR方法建立的模型,其精度取决于提取的主成分个数。主成分个数过少或过多,将导致模型对训练样本拟合不足或过度拟合,降低模型预测精度。而目前常用的主成分个数选取方法交叉验证(cross validation)法不仅计算量大,且易引起过拟合[4, 5]。ANN方法虽然具有很强的逼近能力,但需要通过大量的实验摸索才能确定合适的神经网络模型及参数设置,其应用效果依赖于使用者的经验[6]。因此,不利于光谱实时分析。

    近年来在机器学习领域提出的Boosting算法[7~11],可显著提高模型的预测精度[8, 12]。本研究将该算法引入到光谱分析中,提出一种新的BoostingPLS (BPLS)建模算法。该算法使用根据统计学习理论提出的迭代停止判据,可有效防止过拟合,建立的模型预测精度高,计算简便快速。目前已应用于自行研制的紫外光谱在线水质分析仪中总有机碳(TOC)参数的建模和预测。对一组实测水样数据,分别采用BPLS、PLS、PCR和ANN算法建立数学模型的计算结果表明,BPLS算法建立的模型对水质参数TOC的预测精度显著高于其他3种方法。

     2 分析过程设计和算法原理

    2.1 样品来源及实验设备 ......

您现在查看是摘要页,全文长 12118 字符