当前位置: 首页 > 期刊 > 《中国中药杂志》 > 2017年第7期 > 正文
编号:13060491
随机森林算法在中药指纹图谱中的应用:以不同品牌夏桑菊颗粒指纹图谱分析为例(3)
http://www.100md.com 2017年4月1日 《中国中药杂志》2017年第7期
     PLSDA来源于PLS运算算法,首先构建一个虚拟的矩阵Y来描述样本性质,然后按照上述PLS运算所建立的回归模型就称为PLSDA。偏最小二乘法判别分析(PLSDA)是基于偏最小二乘法上的一种监督模式识别方法,是一种可以同时实现多元线性回归、主成分分析的数据分析方法。它的主要原理是先利用PLS提取样本的主成分,然后将主成分作为新变量建立训练样本自变量和分类变量之间的回归模型,进行判别分析[16]。

    2.4.4 随机森林(random forest,RF) 随机森林是由Leo Breiman提出的一种基于树分类器的集成算法,其包含了2种十分有效地机器学习技术:Bagging和随机变量选择[17]。Bagging算法是通过bootstrap法(鞋带法)有放回的采样构建多个训练集,最后的预测结果由所有构建的分类器进行投票表决得到。随机森林是在Bagging的方法进一步地发展,其在构建每个独立树分类器的时候并不是使用所有的变量,而是随机的从所有变量中选择一部分进行节点的劈分。随机森林算法实现流程如下[18]。①用Bagging方法构造单个独立训练集,每个训练集都是从原始训练集的N个样品中有放回地抽取m个样品。②对于每个独立训练集,用如下过程生成一棵不经剪枝的分类回归树。设共有M个原始变量,给定一个正整数mtry,满足mtry (夏伯候 胡玉珍 熊苏慧 唐洁 闫庆梓 林丽美)
上一页1 2 3 4下一页