基于C4.5和随机森林算法的中医药院校毕业生就业预测应用研究(2)
2.3 C4.5算法计算步骤C4.5算法在ID3算法的基础上进行了改进。C4.5算法使用信息增益率作为选择分裂属性的标准,引入了正则化系数进行初步的剪枝避免过拟合[8],离散化处理连续属性,通过加权方式处理缺失值。
3 随机森林算法
随机森林是2001年由美国科学院院士Breiman教授提出的,结合了Bagging和Random Subspace的思想一种算法。随机森林是由多个决策树而形成的一种集成分类器模型[2]。随机森林算法是由多棵决策树作为基学习器,利用Baging生成不同的训练集,在单棵树的训练过程中引入随机属性选择,训练多次,得到多棵不同的决策树,将这些树组合成随机森林分类器 ......
您现在查看是摘要页,全文长 2828 字符。