当前位置: 首页 > 期刊 > 《南京中医药大学学报》 > 2021年第1期
编号:238300
淋巴瘤医案不同聚类分析方法比较研究
http://www.100md.com 2021年2月22日 南京中医药大学学报 2021年第1期
分散性,方剂,1资料与方法,1数据采集,2数据库构建,3纳入与排除标准,4诊断与中医证候分型标准,5数据预处理,6数据规范化,7数据分析,8方法学差异性研究设计,2结果,1研究总体描述,2医案疗效评估,3药物分散性聚类,4方
     朱垚,陆明,杨涛,倪海雯

    (1.南京中医药大学第一临床医学院,江苏 南京 210023;2.南京中医药大学针灸推拿学院·养生康复学院,江苏 南京 210023;3.南京医中数据挖掘中心,江苏 南京 210029;4.南京中医药大学人工智能与信息技术学院,江苏 南京 210023;5.南京中医药大学附属医院,江苏 南京 210029)

    基于中医临床医案的数据挖掘与知识发现是近年来中医药研究的热点之一。中医医案数据挖掘虽然研究方法众多,但符合中医临床辨治特点且能有效总结专家经验的挖掘方法,主要还是以频数解构、关联规则、聚类分析为主。聚类分析是将数据分到不同类的过程,同一个类中的数据有较大相似性,而不同类间的数据差异性较大。聚类分析是一种探索性的数据挖掘方法,在分类过程中,不必预先制定分类标准,聚类分析能够从样本数据出发自动分类。通过对中医医案实际数据样本集的系列研究发现,同一医案数据样本集所采用的聚类分析方法不同,结论亦有较大差异。不同研究者对于同一组数据进行相同的聚类分析方法,由于研究设计不同,所得到的聚类值也不尽相同。因此,基于中医药学知识发现的客观规律与前期大量中医医案数据挖掘实践[1-5],本团队提出药物分散性聚类与方剂分散性聚类的概念,并根据聚类分析在中医医案研究中的主要目的,确立药物分散性聚类与方剂分散性聚类的内涵及外延,以期扩展和丰富聚类分析在中医医案数据挖掘领域的应用。本文采用淋巴瘤医案为范例数据,对不同聚类分析方法的挖掘结果进行比较,从而分析中医医案采用不同聚类分析方法的优化方案与结果差异,为中医药数据挖掘提供更加优化的研究范式。

    1 资料与方法

    1.1 数据采集

    本研究采用数据挖掘中的单源数据库类研究,旨在研究单一来源数据库的医案数据结构特点,其优势在于能够有效降低建库噪点,减少研究复核能耗,留存单源数据研究样本,为多源数据库类研究形成比对数据,确保后续多源数据库类医案研究的差异值显现最大化。

    选择目标单源数据库为中国知网(CNKI),进行“淋巴瘤”单病种、单源数据库类医案研究论文检索。论文数据库保留Download Index索引清单,进行双人复核,确保论文数据库与索引清单的量值一致。检索式:(SU="淋巴瘤") AND (SU="国医大师" OR SU="名老中医") AND (SU="验案" OR SU="经验" OR SU="治验" OR SU="医案"),检索时间设置为1988年1月1日-2019年8月15日。

    1.2 数据库构建 ......

您现在查看是摘要页,全文长 15641 字符