当前位置: 首页 > 期刊 > 《分析化学》 > 2006年第9期
编号:11201544
基于移动窗口迭代遗传算法的近红外光谱波长选择方法
http://www.100md.com 《分析化学》 2006年第9期
近红外光谱,波长选择,移动窗口,偏最小二乘,遗传算法,,近红外光谱,波长选择,移动窗口,偏最小二乘,遗传算法,1引言,2算法部分,3结
     摘要 光谱样本数据常会受到环境噪声和其它组分的干扰,应作波长选择,以提高分析精度。近红外光谱谱区宽,搜索空间过大,难以直接采用遗传算法进行波长选择。为此本研究提出先用移动窗口偏最小二乘法(MWPLS)从宽谱区中初选出信息区间,再采用改进的迭代遗传算法(IGA)从中选出最优的信息子区间。MWPLS用移动窗口沿全谱区扫描,对信息区间的定位效果好,而IGA将顾及光谱数据的连续相关特性,运行多轮GA,并以上轮选择结果平滑处理后作为先验知识支持下轮的种群初始化。由此选出的连续相邻的波长点作为自变量,进行PLS建模,既可显著地简化模型,又保留一定的数据冗余,模型的稳健性好,分析精度高。将其用于小麦水分的近红外分析,效果良好,预测性能明显优于其它方法。

    关键词 近红外光谱, 波长选择, 移动窗口, 偏最小二乘, 遗传算法

    1 引言

    近红外分析因其快速简便等优点被广泛应用于石油化工、高分子、食品和医药等行业,如检测组分含量、汽油辛烷值、干点等。近红外光谱信号除样品信息外,还包含其他无关信息和噪声。近红外分析通常采用线性模型,而波长选择能够剔除与待分析性质无关或呈非线性关系的波长点,从而可提高分析精度,简化分析模型[1]。波长选择的实质是搜寻波长点,即建模变量的最优组合,使所建预测模型的预报误差最小。常用方法有:专家选择,即凭借专家的经验选定;数学优化选择法,从组合优化出发,主要有模拟退火[2]、禁忌搜索[3]和遗传算法[4~6]等;有效信息区间定位法,分别考察所划分的各波长区间,从中挑选较优者,其中饱含适于建模预测的有效信息,称为信息区间(information region),主要有区间偏最小二乘(interval PLS,iPLS)[7],移动窗口偏最小二乘(Moving Window PLS,MWPLS)[8]等。上述方法各有优缺点,后两类可自动选择,无需领域专家介入。但是区间定位法往往只是粗略估计,并非最优选择。而经典的数学优化法未考虑光谱数据连续相关性的特点,以其优选的波长点建模,稳健性较差。光谱数据的连续相关性是指入选的波长点具有高信息量,其邻域内的波长点也具有较高信息量,将这些高信息量的波长点都引进模型,有一定的数据冗余,可提高模型的抗干扰能力,使之更具稳健性[8]。

    近年来遗传算法用于波长选择的研究逐步深入,得到广泛应用。为避免搜索空间过大而影响寻优效果,常要求原始波长点数不超过200。近红外谱区为700~2500 nm ......

您现在查看是摘要页,全文长 9497 字符