聚类分析法在糖尿病临床护理中的应用(1)
【摘要】 通过分析数据挖掘算法——聚类分析在糖尿病临床护理中的应用,探索护理学临床的分析方法,对笔者所在医院收治的52例糖尿病患者的临床资料进行聚类分析;同时,对聚类分析结果进行总结,对不同类别患者提出相应的护理措施,以增强护理经验,有效提高糖尿病患者的护理质量,从而提高护理水平。
【关键词】 聚类分析法; 糖尿病; 临床护理
中图分类号 R473.5 文献标识码 B 文章编号 1674-6805(2014)33-0157-03
糖尿病是受遗传因素或环境因素所导致的一种全身性、代谢性、慢性疾病,全世界至少有一亿多人患有此病。我国的患病率已达成3%,发病人数近4000万。在糖尿病的防治中,医护人员的角色尤为重要[1]。这也要求护理人员在掌握医学知识的同时,也要学习和应用与护理相关的边缘学科知识,更新知识结构,提高护理水平。数据挖掘算法——聚类分析已广泛应用于经济学、管理学、社会学、医学等众多领域,本文将结合笔者所在医院收治的52例糖尿病患者的临床资料,分析聚类算法在临床护理中的应用。
, 百拇医药
1 聚类分析
聚类分析是本文采用的数据分析处理方法。它无需先验知识,也可以不确定分类标准,能够自动地把待分析的数据按照一定的处理规则完成数据分类。其处理规则有制定数据中心点的距离或其他亲密程度[2]。数据经过处理的结果是相同类具有相似性,不同类数据具有明显的区别。按照“相关系数”分类的称为R型聚类法,按照“距离”分类的称为Q型聚类法[3]。常用的聚类分析方法有三种:层次聚类法、快速聚类法、两步聚类法。
1.1 层次聚类法
第一步骤,将待分类数据拟定为N类;第二步骤,用指定的距离或相似系数将最相关的两类数据归并为一类,其余数据集不发生聚类;第三步骤,重复进行第二步骤,依此减少数据类别,直到最后所有数据完成归类;第四步骤,根据相应的指标来确定最为合适的类别数量[4]。
1.2 快速聚类法
, 百拇医药
又称作K-均值聚类法。第一步骤,拟定分类群数,确定初始类中心点;第二步骤,计算所有分类数据点到类中心点的欧氏距离,把靠近类中心点的数据聚集,完成一次迭代过程;第三步骤,再完成上述过程后重新计算每类中各个变量的变量值平均数,用此均值点作为新的类中心点[5]。重复前面步骤,直到完成终止迭代的判别要求或达到指定的迭代次数。这种聚类法由于不存储距离矩阵或基本数据,因而不出现多个相互嵌套的聚类结果,整个分析过程使用迭代的方式进行,所以计算速度快。
1.3 两步聚类法
顾名思义整个聚类过程需要进行两个步骤。第一步骤,规划一个最大群,这些数据要按照相应的规则处理成N群;第二步骤,采用层次聚类法,把N群中最为接近的子群进行归并,达到拟定的标准时停止处理,形成最终的群数,作为聚类结果。这种方法特点:能做大数据集处理、能做多类型数据处理、能做异常数据值处理、无需在处理开始前指定个数、能从几种聚类方案中选择出最佳方案等[6]。它是基于人工智能的发展起来的智能聚类方法。
, http://www.100md.com
2 分析工具
本文使用的专业数据分析工具软件是SPSS 15.0。SPSS(Statistics Package for Social Science)是聚类分析常用的工具软件。运行环境:Windows系统;运用范围:医疗卫生、教育科研、企业管理、通讯等行业领域;软件功能:数据整理、数据分析、结果输出;分析方法:基本统计分析、相关分析、回归分析、方差分析、聚类分析与判别分析、时间序列分析、信度分析、主成分与因子分析等类别。SPSS优点在于采用易于操作的窗口界面,对数据能进行统计分析、图表展示、管理与输出,因此成为目前使用最为广泛的专业数据分析工具。
3 分析步骤
3.1 临床资料
糖尿病的典型症状;三多一少,即多食、多饮、多尿,体重减少。其中,大部分患者属无症状型糖尿病。糖尿病引起的并发症:酮症酸中毒、高渗性昏迷、血管损害、神经系统损害等。糖尿病的发展一般经过高危人群阶段、血糖增高阶段、糖尿病等三个阶段[7]。
, 百拇医药
选取笔者所在医院2009年4月-2012年3月收治的52例糖尿病患者,其相关临床资料作为分析数据源。所有患者全部符合1997年WHO提出的糖尿病诊断标准。其中男30例,女22例。年龄46~71岁,平均62岁,以55~65岁最多,占61.2%。并发糖尿病足2例,糖尿病肾病5例,糖尿病视网膜病变4例,糖尿病周围神经病变17例。
3.2 方法
3.2.1 量表编制 量表名称为“糖尿病临床护理诊断量表”,该量表所采用的护理诊断指标均符合北美护理诊断协会(NANDA)对护理诊断的定义。用李科特5级量表形式,从0~4来反映指标高低程度:如“感染危险”指标为4,表明危险度高;如果“感染危险”指标为0,表明危险度低(表1)。对指标分值的确定根据护理诊断依据,如“自理缺陷”指标的分值:0=完全独立;1=需要使用辅助器具;2=需要少量帮助;3=需要帮助或监护;4=需要全部帮助或不能协作[1],其他指标分值采用同样方法确定。
3.2.2 量表应用 采用SPSS 15.0 for Windows在电脑上导入经匿名化处理的EXCLE样本数据,调用描述统计量、两步聚类分析步骤等处理,见图1。
聚类分析语法如下。
3.2.3 分类结果 从SPSS聚类分析结果来看,糖尿病患者临床相关护理诊断指标如知识缺乏、便秘、睡眠型态紊乱、舒适的改变、潜在并发症、感染的危险、受伤的危险、组织完整性受损等关联度高。如焦虑度高类别的患者,睡眠型态紊乱度也相应高,同时也反映在便秘指标;而知识缺乏度高类别的患者,感染危险指标和受伤危险指标也较其他类别患者高;感染危险指标高的患者,其平均年龄高于其他类别的患者等。, 百拇医药(刘玲)
【关键词】 聚类分析法; 糖尿病; 临床护理
中图分类号 R473.5 文献标识码 B 文章编号 1674-6805(2014)33-0157-03
糖尿病是受遗传因素或环境因素所导致的一种全身性、代谢性、慢性疾病,全世界至少有一亿多人患有此病。我国的患病率已达成3%,发病人数近4000万。在糖尿病的防治中,医护人员的角色尤为重要[1]。这也要求护理人员在掌握医学知识的同时,也要学习和应用与护理相关的边缘学科知识,更新知识结构,提高护理水平。数据挖掘算法——聚类分析已广泛应用于经济学、管理学、社会学、医学等众多领域,本文将结合笔者所在医院收治的52例糖尿病患者的临床资料,分析聚类算法在临床护理中的应用。
, 百拇医药
1 聚类分析
聚类分析是本文采用的数据分析处理方法。它无需先验知识,也可以不确定分类标准,能够自动地把待分析的数据按照一定的处理规则完成数据分类。其处理规则有制定数据中心点的距离或其他亲密程度[2]。数据经过处理的结果是相同类具有相似性,不同类数据具有明显的区别。按照“相关系数”分类的称为R型聚类法,按照“距离”分类的称为Q型聚类法[3]。常用的聚类分析方法有三种:层次聚类法、快速聚类法、两步聚类法。
1.1 层次聚类法
第一步骤,将待分类数据拟定为N类;第二步骤,用指定的距离或相似系数将最相关的两类数据归并为一类,其余数据集不发生聚类;第三步骤,重复进行第二步骤,依此减少数据类别,直到最后所有数据完成归类;第四步骤,根据相应的指标来确定最为合适的类别数量[4]。
1.2 快速聚类法
, 百拇医药
又称作K-均值聚类法。第一步骤,拟定分类群数,确定初始类中心点;第二步骤,计算所有分类数据点到类中心点的欧氏距离,把靠近类中心点的数据聚集,完成一次迭代过程;第三步骤,再完成上述过程后重新计算每类中各个变量的变量值平均数,用此均值点作为新的类中心点[5]。重复前面步骤,直到完成终止迭代的判别要求或达到指定的迭代次数。这种聚类法由于不存储距离矩阵或基本数据,因而不出现多个相互嵌套的聚类结果,整个分析过程使用迭代的方式进行,所以计算速度快。
1.3 两步聚类法
顾名思义整个聚类过程需要进行两个步骤。第一步骤,规划一个最大群,这些数据要按照相应的规则处理成N群;第二步骤,采用层次聚类法,把N群中最为接近的子群进行归并,达到拟定的标准时停止处理,形成最终的群数,作为聚类结果。这种方法特点:能做大数据集处理、能做多类型数据处理、能做异常数据值处理、无需在处理开始前指定个数、能从几种聚类方案中选择出最佳方案等[6]。它是基于人工智能的发展起来的智能聚类方法。
, http://www.100md.com
2 分析工具
本文使用的专业数据分析工具软件是SPSS 15.0。SPSS(Statistics Package for Social Science)是聚类分析常用的工具软件。运行环境:Windows系统;运用范围:医疗卫生、教育科研、企业管理、通讯等行业领域;软件功能:数据整理、数据分析、结果输出;分析方法:基本统计分析、相关分析、回归分析、方差分析、聚类分析与判别分析、时间序列分析、信度分析、主成分与因子分析等类别。SPSS优点在于采用易于操作的窗口界面,对数据能进行统计分析、图表展示、管理与输出,因此成为目前使用最为广泛的专业数据分析工具。
3 分析步骤
3.1 临床资料
糖尿病的典型症状;三多一少,即多食、多饮、多尿,体重减少。其中,大部分患者属无症状型糖尿病。糖尿病引起的并发症:酮症酸中毒、高渗性昏迷、血管损害、神经系统损害等。糖尿病的发展一般经过高危人群阶段、血糖增高阶段、糖尿病等三个阶段[7]。
, 百拇医药
选取笔者所在医院2009年4月-2012年3月收治的52例糖尿病患者,其相关临床资料作为分析数据源。所有患者全部符合1997年WHO提出的糖尿病诊断标准。其中男30例,女22例。年龄46~71岁,平均62岁,以55~65岁最多,占61.2%。并发糖尿病足2例,糖尿病肾病5例,糖尿病视网膜病变4例,糖尿病周围神经病变17例。
3.2 方法
3.2.1 量表编制 量表名称为“糖尿病临床护理诊断量表”,该量表所采用的护理诊断指标均符合北美护理诊断协会(NANDA)对护理诊断的定义。用李科特5级量表形式,从0~4来反映指标高低程度:如“感染危险”指标为4,表明危险度高;如果“感染危险”指标为0,表明危险度低(表1)。对指标分值的确定根据护理诊断依据,如“自理缺陷”指标的分值:0=完全独立;1=需要使用辅助器具;2=需要少量帮助;3=需要帮助或监护;4=需要全部帮助或不能协作[1],其他指标分值采用同样方法确定。
3.2.2 量表应用 采用SPSS 15.0 for Windows在电脑上导入经匿名化处理的EXCLE样本数据,调用描述统计量、两步聚类分析步骤等处理,见图1。
聚类分析语法如下。
3.2.3 分类结果 从SPSS聚类分析结果来看,糖尿病患者临床相关护理诊断指标如知识缺乏、便秘、睡眠型态紊乱、舒适的改变、潜在并发症、感染的危险、受伤的危险、组织完整性受损等关联度高。如焦虑度高类别的患者,睡眠型态紊乱度也相应高,同时也反映在便秘指标;而知识缺乏度高类别的患者,感染危险指标和受伤危险指标也较其他类别患者高;感染危险指标高的患者,其平均年龄高于其他类别的患者等。, 百拇医药(刘玲)