数据挖掘技术在预测精神分裂症复发中的应用(2)
第1页 |
参见附件。
表1 各自变量相对重要性排序情况
排序C5.0决策树模型BP神经网络模型
1负性生活事件负性生活事件
2家族史遵医服药
3遵医服药家族史
4实施心理干预社会支持程度
5社会支持程度经济收入层次
6经济收入层次实施心理干预
7首次治疗效果首次治疗效果
2.2 模型的效果
从所建两个预测模型的效果来看,无论是在训练样本集还是检验样本集里,神经网络的准确率均高于决策树模型。两个模型均呈现训练数据集的预测效果与检验数据集的中的预测效果差别不大,模型比较稳定。具体的情况为,在训练样本集里,决策树的准确率、灵敏度和特异度分别为76.61%、72.47%和80.41%,神经网络模型为83.33%、81.46%和85.05%;在检验样本集里,决策树的准确率、灵敏度和特异度分别为76.77%、69.84%和81.52%,神经网络模型为81.29%、79.37%和82.61%;在全样本数据集里,决策树的准确率、灵敏度和特异度分别为76.66%、71.78%和80.77%,神经网络模型为82.73%、80.91%和84.27%。详见表2。
表2 所建预测模型的效果评价情况 例
样本类型C5 ......
您现在查看是摘要介绍页,详见PDF附件。