当前位置: 首页 > 期刊 > 《医学信息》 > 2017年第18期
编号:13115234
eCRF及数据挖掘技术在中医药治疗AIDS中远程疗效分析的应用(3)
http://www.100md.com 2017年5月7日 《医学信息》 2017年第18期
     我们从2011年就开始使用ClinReseach系统进行数据采集工作,历经六年多时间,目前取得了数据大量的数据,包括患者基础数据,治疗前后的症状体征积分及实验室指标、 WHO-HIV生存质量量表及PRO(患者报告结局)量表等數据表,含有体温、呼吸、心率、舒张压(mmHg)、收缩压(mmHg)、形体、营养、体格检查及实验室检查各种指标及生存质量量表字段、患者报告结局量表字段,舌质、脉象、分期、时期、中医辨证分型等516个字段(fields),数据记录(records)过万条,利用这些宝贵的临床数据,我们使用SPSS Clementine作为数据挖掘工具,数据挖掘可以建立六种模型:分类(classification),回归(Regression)、时间序列(Time Series)、聚类(Clustering)、关联规则(Association)以及顺序规则(Sequence)。分类及回归主要用来作预测,而关联规则与顺序规则主要是用来描述行为,聚类则是二者都用得上。我们取得数据挖掘的成果众多,下面以回归分析法为例子进行说明。回归分析法是定量预测方法之一,它依据事物内部变化的因果关系来预测事物发展的发展趋势。由于它依据的是事物内部的发展规律,因此这种方法比较精确。在SPSS Clementine 中,我们使用线性回归节点生成线性回归模型,该模型根据输入字段估计预测输出字段预测输出字段的最佳线性方程。有时还配合穿插使用SPSS 17.0进行t检验及相关分析等。以下是取得的部分研究结果:

    2.1 生存分析的相关影响因素

    在临床上,我们一直探索与艾滋病死亡相关的因素,通过对六年以来积累的数据的挖掘,经用T检验发现,死亡病例与非死亡的病例的CD4计数存在显著性差异,这个结果是显而易见的。但有些结果则“埋得”较深 ......
上一页1 2 3

您现在查看是摘要页,全文长 6928 字符