当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2012年第3期
编号:13181877
数据挖掘技术在中医药领域应用(1)
http://www.100md.com 2012年3月1日 《中国中医药信息》 2012年第3期
     关键词:数据仓库;数据挖掘;中医药;综述

    DOI:10.3969/j.issn.1005-5304.2012.03.049

    中图分类号:R2-03 文献标识码:A 文章编号:1005-5304(2012)03-0099-02

    近年来,运用新科技促进中医药现代化已成为中医药的发展趋势。从20世纪80年代至今已有一批中医药数据库较好地解决了中医药信息资源索取的困难,为中医药事业的发展起到了一定的推进作用。但是,中医本身是一个非线性、多维、复杂而庞大的系统,其中蕴藏着海量的信息与数据,简单的数据处理工具和浅层的、经验性的中医信息分析处理已不能解决中医现代化发展的根本要求,随着用户需求的不断提高,现有数据库系统的模式和内容已难以满足需求。而数据挖掘技术正适用于复杂、多维的系统,能借助于大量的数据,通过相应的算法寻找其中规律,有可能突破中医药“信息庞杂,知识匮乏”的局限性。笔者以数据挖掘技术为主要目标,通过调研近10年相关文献,探讨数据挖掘技术在中医药方面应用的技术支持、应用方向及可发展性。

    1 数据挖掘技术应用于中医药的技术支持

    数据挖掘就是从海量的、不完全的、有噪声的、模糊的、看似随机的数据集合中,提取隐含其中的、事先未预知的、但又有价值的知识和规律的过程[1]。目前,数据挖掘的主要算法有聚类分析、因子分析、主成分分析、关联规则分析、粗糙集、贝叶斯网络、神经网络、人工智能等。这些算法各有特点,根据主题的不同,可以采用不同的算法。如中医方剂研究多用关联规则分析,找出复方中的主要及配伍规律;中医定量诊断可以用叶贝斯网络;对中医医案的挖掘可以用聚类分析等。

    2 数据挖掘技术在中医药领域的主要应用

    2.1 方剂研究

    中药方剂是中医治疗的主要手段,通过辨证立法,以法统方,以方遣药。在方剂中,方、药、证之间存在着错综复杂的对应关系。由于数据挖掘技术可以反映多维数据之间的相互映射关系,为现代方剂的研究提供了非常有力的研究工具。当前在中医领域,数据挖掘应用最广泛的是在中药(复方)的研究中,并已经取得了一定的进展。张氏等[2]利用关联规则,探讨了古今哮喘方的用药规律,对古今治疗哮喘用药进行对比,得出治疗哮喘的核心药物为麻黄、杏仁、甘草、半夏和五味子等,麻黄-杏仁、麻黄-甘草、杏仁-甘草、麻黄-半夏、半夏-甘草为高频药对。翁氏等[3]利用关联规则分析,挖掘了明清治疗脾胃湿热的用药及配伍规律,明清医家治疗脾胃湿热型黄疸多用茵陈蒿,是清热退黄的主药;而且,茵陈蒿主要与利水渗湿药和行气药配伍应用。组方上多在“化湿、健脾、清热、理气”中变构。张氏等[4]利用关联分析中医治疗肾病用药得出:人参与黄芪在治疗肾病的方剂中同时出现的频数为11.1%,在含有人参的治疗肾病的方剂中,含有黄芪的占50.5%;同时,从上述关联规则中可以看到,在治疗肾病的方剂中,与生地黄配伍的中药中一定有黄芪。该研究的意义在于通过采用关联规则分析方法,可以在宏观层次上认识肾病复方配伍特点,对肾病复方的配伍规律在单味药层次上进行了初步的探索研究,以期提取出反映治疗肾病的核心处方和整体用药规律。

    2.2 中医证候研究

    中医证候系统庞大而复杂,诊断系统又是一个非线性的、多维多阶的、可以无限组合的复杂巨系统,用线性研究的方法则无法真正进行规范[5],而数据挖掘可通过大量的临床数据,发现证型和症状之间的关系,进而辅助临床诊断。王氏等[6]应用贝叶斯网络方法,通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断,得到血瘀证的7个关键表现是疼痛、肢麻、舌青紫、舌体瘀斑、舌脉曲张、口唇黯红和脉涩,并定量计算其诊断贡献度。吴氏等[7]以肾阳虚证量表为基础,从定性、定量角度收集资料,探讨了肾阳虚证的辨证。用定性评分计算各辨证因子的出现频率,用定量评分进行分层聚类分析。最后得出恶寒、肢冷、夜尿、腰背冷等辨证因子,聚类分析提示肾阳虚主证、舌象、脉象分布较有规律。根据数理统计结果对肾阳虚证的辨证因子进行初筛,为肾阳虚证量化研究奠定了基础。

    2.3 医案研究

    医案是中医诊疗活动的记录,其内容纷繁复杂。若先对各要素进行标准化处理,再使用数据挖掘技术,分析定性变量对病证的贡献度,从而可掌握更多、更客观的证候规则。陈氏[8]通过数据挖掘技术中的关联规则分析探讨古代名医中风医案,得到古代名医治疗中风时经常使用的中药有枸杞子、地黄、当归、牛膝、天麻、石斛、肉苁蓉,并找出了治疗中风常用的药对;提出了一个萃取古代各家名医治疗各种病证经验的方法与模式,并经由中风病的验证,证明了本模式的可行性。洪氏等[9]认为,虽然目前有许多医案类数据库,但单纯的数据库,仅有查询功能,失去了数据库的核心——分析功能,只有通过对数据库的大量数据的分析和挖掘,才能找到其中科学化成分,并认为数据挖掘是达到这个目的的主要手段。孙氏等[10]也强调了数据挖掘技术在中医医案整理中的应用,给出了数据挖掘技术在医案信息挖掘中的过程,以及应用于医案整理的数据挖掘方法,如描述性分析、聚类分析、关联分析等。

    2.4 中医专家系统

    为了更好地继承中医专家的经验,20世纪90年代,许多专家系统应时而生,如《方药的计算机分析》、《运用计算机总结董建华教授论治胃脘痛经验》等,但由于条件的限制及各种方法的局限性,老中医经验的传承还需要采取新的方法和技术来解决存在的问题,不断提高学术继承的水平。王氏等[11]提出运用数据仓库及数据挖掘技术,保存老专家临床诊疗数据的同时,运用关联规则分析、因子分析、判别分析、决策树等对收集的数据进行分析挖掘,并形成知识库。田氏等[12]以Statistic6.0统计分析软件为数据挖掘工具,运用描述统计量分析、频数分析、关联分析、判别分析、决策树和神经网络对数据库中与辨证相关的数据进行分析、挖掘,探索名老中医诊疗眩晕病辨证思维模式,并对其间的规律做了初步的总结。, http://www.100md.com(曾悦 张君)
1 2下一页