当前位置: 首页 > 期刊 > 《医药产业资讯》 > 2017年第24期
编号:13082894
基于C4.5和随机森林算法的中医药院校毕业生就业预测应用研究(2)
http://www.100md.com 2017年10月8日 《中国医药导报》 2017年第24期
     2.3 C4.5算法计算步骤

    C4.5算法在ID3算法的基础上进行了改进。C4.5算法使用信息增益率作为选择分裂属性的标准,引入了正则化系数进行初步的剪枝避免过拟合[8],离散化处理连续属性,通过加权方式处理缺失值。

    3 随机森林算法

    随机森林是2001年由美国科学院院士Breiman教授提出的,结合了Bagging和Random Subspace的思想一种算法。随机森林是由多个决策树而形成的一种集成分类器模型[2]。随机森林算法是由多棵决策树作为基学习器,利用Baging生成不同的训练集,在单棵树的训练过程中引入随机属性选择,训练多次,得到多棵不同的决策树,将这些树组合成随机森林分类器 ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 2828 字符