当前位置: 首页 > 期刊 > 《医学信息》 > 2019年第1期
编号:13329128
分类算法在高血压诊断中的应用研究(1)
http://www.100md.com 2019年1月8日 《医学信息》 2019年第1期
     摘要:高血压作为一种严重影响人类健康的心脑血管疾病,越来越得到人们的重视,如何利用数据挖掘技术从大量的病例中发现潜在的发病机理成为生物信息学研究的热点。本文首先采用数据清理、变换等预处理技术对医院提供的大量生化检验数据进行处理,提取GLU、TC、TG等影响高血压的主要生理体征属性;然后,针对C4.5算法在体征属性选择方面存在的偏离问题,引入属性权重的概念,对C4.5算法进行改进;最后,基于改进的C4.5算法构建决策树,并从中提取用于诊断的分类规则。实验证明,构建的决策树模型符合医学认识,准确率较高,为辅助医生诊断和治疗高血压疾病提供了有力的科学依据。

    关键词:高血压;决策树;分类;C4.5;GLU;TC;TG

    中图分类号:R319 文献标识码:A DOI:10.3969/j.issn.1006-1959.2019.01.001
, 百拇医药
    文章編号:1006-1959(2019)01-0001-03

    Application of Classification Algorithm in Diagnosis of Hypertension

    DAI Xiao-min1,DING Yong2

    (1.Department of Cardiology,Zhoupu Hospital,Pudong New Area,Shanghai 200120,China;

    2.Taizhou Institute of Science and Technology,Nanjing University of Science and Technology, Taizhou 225300,Jiangsu,China)
, 百拇医药
    Abstract:As a cardiovascular and cerebrovascular disease that seriously affects human health, hypertension has been paid more and more attention. How to use data mining technology to discover potential pathogenesis from a large number of cases has become a hot spot in bioinformatics research. In this paper, the data processing, transformation and other pre-processing techniques are used to process the large amount of biochemical test data provided by the hospital, and the main physiological signs of hypertension, such as GLU, TC and TG, are extracted. Then, for the deviation problem of C4.5 algorithm in the selection of the attribute of the sign, the concept of attribute weight is introduced to improve the C4.5 algorithm. Finally, the decision tree is constructed based on the improved C4.5 algorithm and extracted for diagnosis classification rules.The experiment proves that the constructed decision tree model is in line with medical knowledge and has high accuracy, which provides a powerful scientific basis for assisting doctors in the diagnosis and treatment of hypertension.
, http://www.100md.com
    Key words:Hypertension;Decision tree;Classification;C4.5;GLU;TC;TG

    高血压(hypertension)是一种常见的心血管疾病,会导致冠心病、糖尿病、脑卒中等并发症的发生,严重威胁到人们的身体健康。除了常规药物治疗方法,近年来使用关联分析[1]、聚类分析[2]、分类分析[3]、回归分析[4]、序列分析[5]等数据挖掘技术辅助疾病诊疗已成为生物信息学研究的热点。数据挖掘技术是数据库知识发现(KDD)中的关键步骤,通常指从大量无序的数据中挖掘隐藏于其中的规律,因此可以利用数据挖掘技术从大量的高血压电子病历中提取有价值的数据,并从中挖掘导致高血压疾病的发病机理和生理特征,以便于医生更科学、准确地诊断和预测高血压等心脑血管疾病[6-9]。

    有不少学者提出将数据挖掘相关技术应用到高血压等心脑血管疾病研究中。甘昕艳等[10]以某社区医院电子病历作为数据源,在数据的采集、清理、筛选的基础上,利用不同的数据挖掘算法,建立不同的挖掘模型,并通过IBM SPSS Modeler挖掘平台进行对比分析,为医务人员提供了适合各种病种的诊疗模型。王维樵[11]基于实验信息系统(LIS)与医院信息系统(HIS)提供的生化检验数据,采用SPSS统计软件和数据挖掘技术,提取10项有价值的指标建立人工神经网络诊断模型,对心脑血管疾病发生率进行有效评估。马宗帅[12]提出将深度学习算法应用到心脑血管疾病预测中,在对生理数据集进行归一化处理的基础上,基于受限玻尔兹曼机网络和BP神经网络,构建基于DBN的心脑血管疾病预测模型,并通过大量实验验证模型的识别率。王专等[13]提出将人工智能、大数据技术应用到高血压的治疗效果分析中,搭建了基于Hadoop分布式计算平台以及Hbase分布式数据库的大数据疾病分析系统,能够对提供的海量高血压案例数据进行大规模分类建模与计算,实现高血压疗效的科学分析以及用药推荐等功能[14,15]。, 百拇医药(戴晓敏 丁勇)
1 2下一页