基于关联规则挖掘的白细胞减少症方药规律分析(2)
1 材料与方法1.1 数据收集
本研究数据来源于中国中医科学院中医药信息研究所研制开发的《中医临床诊疗文献数据库》。该库用人工摘录的方式从中医临床文献中收集病例采集人群、疾病证候、方剂、中药相关信息。中医药临床文献的选择标准:研究对象为人类,文献类型包括临床试验、对照试验、随机对照试验、Meta分析等。排除标准:综述、经验总结、理论探讨、实验研究等。以“白细胞减少”及“中医药”为关键词在《中医临床诊疗文献数据库》中检索,时间跨度1998-2008年,共纳入有效文献678篇。
1.2 数据挖掘
1.2.1 描述性分析 准备工作包括数据准备及清理。数据准备及清理主要是将同种中药的不同名称统一及对重复文献进行筛选,再用Access建立数据库。其次,各药使用频率为该中药的使用次数与所有方剂里全部中药的总数之比。
1.2.2 关联规则挖掘 采用SAS 9.2 for Windows 中的Enterprise Miner模块为挖掘工具来探讨方剂配伍。关联是指两个或多个变量的取值之间存在某种规律性。关联规则具有如下两个重要的属性:支持度:P(A∪B),即A和B这两个项集在事务集D中同时出现的概率。置信度:P(B|A),即在出现项集A的事务集D中,项集B也同时出现的概率。
1.3 数据规范
包括补充缺失数据,删除错误数据,并根据中国中医科学院中医药信息研究所编写的《中医药主题词表》和《中医药标准表》对方剂名称、中药名称、疾病名称和证候名称进行规范 ......
您现在查看是摘要页,全文长 5543 字符。