664例崩漏医案信息挖掘结果与传统知识比较研究
摘要:目的 对664例崩漏医案信息挖掘结果与传统知识进行比较研究。方法对664例崩漏医案,利用关联分析技术,挖掘高频中药组、高频症状+中药组、高频证型+中药组的规律,并与传统知识进行比对。结果 中药高频组的符合率是88.9%,中药+症状高频组的符合率是45.O%,中药+证型高频组的符合率是100%,同时获得未在传统经典理论中直接表述的知识。结论利用信息挖掘技术发现中医药信息规律是切实可行的,可作为传统知识总结的补充与参考,所发现的结果可以为临床医师提供处方参考。
关键词:中医药;妇科;崩漏;医案;数据挖掘
在妇科医案处方数据中,隐藏着一些在临床上应用良久却尚未著书立说、未被医师主观意识所发现的用药规律。本文通过关联分析技术,对664例崩漏医案的中药、中医证型、症状进行信息处理,挖掘新知,将挖掘结果与传统知识进行比对,探索数据挖掘结果在中医药信息领域的临床适用性。
1、资料
, 百拇医药
1.1 数据来源
中国期刊全文数据库(CNKI)、万方数据库、中国生物医学文献数据库(CBM)。
1.2 检索方法
检索项选择“题名”或“关键词”,检索词为“崩漏”AND(“医案”0R“病案”0R“验案”0R“治验”)。
1.3 文献纳入标准
医案内容必须包括中医诊断、处方、中医证型、症状4项内容。为了提升数据挖掘结果的可靠性,对各部分内容进行严格控制。
1.3.1 中医诊断 必须符合国家中医药管理局1994年颁布的《中华人民共和国中医药行业标准——中医病证诊断疗效标准》。
1.3.2 中药处方 必须为中草药汤剂。单纯或辅助使用针灸、中成药、手术治疗、西药疗法的医案不予收录。
, 百拇医药
1.3.3 中医证型 必须含有病性及病位两个方面的内容。医案内容中只含有病位(如“脾肾为病”),或只含有病性(如“实”、“虚”),不予以收录。
1.3.4 症状 除主症以外,必须有2个以上次要症状。
按照上述标准,本文共采集崩漏医案664例,发表时间为1972-2005年,患者就诊时间为1951-2003年。
2、方法
2.1 数据预处理
对后期数据分析需要的中药、中医证型、症状3个方面的数据进行预处理。对中药名称的选词主要参考《中华人民共和国药典》(2005版)、《中药大辞典》和《中华本草》;对中医证型的选词参考《中国中医药学主题词表》《中医诊断学》《中华人民共和国中医药行业标准一一中医病证诊断疗效标准》等书籍;对症状的选词参考《中国中医药学主题词表》《中医诊断学》《简明中医辞典》等书籍。
, 百拇医药
2.2 数据挖掘工具
应用WEKA软件进行数据挖掘。该软件由中国中医科学院周雪忠教授等人开发,使用Apriori算法进行药物、症状、药症和药证等关联规则的知识发现。
2.3 数据挖掘方法
从不同角度对中药、中医证型、症状三部分内容进行处理,通过对“中药+中药”、“中药+症状”、“中药+证型”3种高频集的分析,获得更多的关联关系。
参考以往研究和多次运行预实验的结果,设定最小支持度为5%,最小置信度为40%。对所得挖掘结果筛选出置信度最高的10个项目集和支持度最高的10个项目集进行分析。
3、结果
对高频中药组、高频症状+中药组、高频证型+中药组3种高频集的挖掘结果进行分析,并与传统知识进行比对。
, http://www.100md.com
3.1 高频中药组与传统理论比对
表1显示,在治疗崩漏医案中,支持度为前10名的药对在传统文献中大部分找到了相应理论依据。例如排名第1位的项集白芍→当归,在《常用中药配对与禁忌》中记载“白芍补血敛阴,柔肝和营。当归补血活血,止痛。白芍酸收性和,守而不走;当归辛香性开,走而不守。二药配伍,一守一行,一开一合,动静结合,补血而不滞血,活血而不耗血。合用共奏养血补血、养肝止痛之功”。但是排名第9位的项集地黄→当归未找到相关的文献描述。
在置信度前10名的药对中,有9对在传统文献中得到认可。例如地骨皮→地黄,在《现代中药炮制手册》驯中记载“地骨皮甘寒清热,凉血止血,生津止渴,生地黄味甘苦性寒,功善清热凉血,又能养阴生津,二药配对,共奏清热凉血、养阴生津之功”。但是排名第9位的药对五灵脂→当归未在传统文献中找到依据。
3.2 高频症状+中药组挖掘结果与传统理论比对
, 百拇医药
表2显示,支持度为前10名的项集在传统文献中大部分都可以找到相应的理论依据。例如排在第1位的项集当归→经血量多,在《中药学》中记载“月经量多有实有虚,实为血热迫血妄行,虚者多为气虚不摄,冲任不调所致,当归多用于此证属虚者”。排名第3位的项集白芍→经血量多,在《中华临床中药学》中记载“白芍养血敛阴,调和气血,可用于妇人冲任损伤不能制约经血,经血非时妄行,或量多如注,或淋漓不断”。数据挖掘结果与传统理论基本相符。
置信度为前10名项集的大部分也找到了相关论述。例如排名第3位的项集五灵脂→腹痛,在《中药学》中记载“五灵脂苦咸温通疏泄,专入肝经血分,长于通利血脉散瘀止痛,为治血瘀诸痛之要药,如胸胁脘腹刺痛,痛经,经闭,产后瘀滞腹痛,骨折肿痛均可施用”。而排名第1位的项集五灵脂→经血有块,虽然分别找到了各自相关内容的描述,但两者之间明显的相关描述未有明显的理念依据。在《中药学》中记载“五灵脂:苦咸甘温,归肝经,功效是通利血脉,活血止痛,散瘀止血”,出现了活血、散瘀的表述;而在《中医诊法学》中对经血有块的描述为“经血有块:主症是气滞血瘀,或寒凝血瘀或气虚血瘀,或热结血瘀”,出现了4次“血瘀”。
, http://www.100md.com
3.3 高频证型+中药组挖掘结果与传统理论比对
表3显示,支持度、置信度前10名的项集全部在传统文献中找到了相应的理论依据。例如支持度排在第1位的项集热→地黄,在《中药学》中记载“地黄性甘苦寒,清热凉血,养阴生津”;置信度排名第1位的桃仁→瘀,在《中药学》中记载“桃仁苦甘平,活血祛瘀,润肠通便,消痈排脓,止咳平喘”。
4、结论
4.1 有效结果
对664例崩漏医案信息支持度和置信度排名前10位的数据进行分析,中药高频组与传统理论的符合率是88.9%,中药+症状高频组的符合率是45.0%,中药+证型高频组的符合率是100%。说明数据挖掘结果与传统理论大体一致,可以看出关联分析技术在妇科医案的规律发现中的合理有效性,数据挖掘信息处理技术可作为传统知识总结的补充,值得进一步研究。
, http://www.100md.com
4.2 产生新知
本次崩漏数据挖掘结果发现一些在传统理论中未直接表述,但在临床处方中经常被应用的规律。例如在高频中药组中的地黄→当归、五灵脂→当归,这两组对药在临床上为医师广为应用,但在现有文献中未找到这两组药物成对使用的理论依据。因此,可以认为这些规律是医师从主观意识上难以察觉到的新知。
4.3 临床参考
本文探讨了中药配伍、高频症状+中药组、高频证型+中药组三种关系,这些关系都是医师在临床上比较关注的方面。例如,在治疗崩漏的瘀证时,教科书中记载的活血化瘀常用药有28个,活血化瘀方剂有8首,如果没有丰富的临证经验,在用药选择上会存在一定困难。而本项研究发现,专家在治疗瘀证时93%都用了桃仁,这些规律可为医师在临证处方时提供用药参考。
本项研究用定量的数理关系把“药证症”相连接,可以更科学地指导临床和科研工作,发现的结果可以为临床医师提供处方参考。, http://www.100md.com(杨阳 崔蒙 田野 王静 亢力 李萌 连超杰 张晶 奚怀平 李园白)
关键词:中医药;妇科;崩漏;医案;数据挖掘
在妇科医案处方数据中,隐藏着一些在临床上应用良久却尚未著书立说、未被医师主观意识所发现的用药规律。本文通过关联分析技术,对664例崩漏医案的中药、中医证型、症状进行信息处理,挖掘新知,将挖掘结果与传统知识进行比对,探索数据挖掘结果在中医药信息领域的临床适用性。
1、资料
, 百拇医药
1.1 数据来源
中国期刊全文数据库(CNKI)、万方数据库、中国生物医学文献数据库(CBM)。
1.2 检索方法
检索项选择“题名”或“关键词”,检索词为“崩漏”AND(“医案”0R“病案”0R“验案”0R“治验”)。
1.3 文献纳入标准
医案内容必须包括中医诊断、处方、中医证型、症状4项内容。为了提升数据挖掘结果的可靠性,对各部分内容进行严格控制。
1.3.1 中医诊断 必须符合国家中医药管理局1994年颁布的《中华人民共和国中医药行业标准——中医病证诊断疗效标准》。
1.3.2 中药处方 必须为中草药汤剂。单纯或辅助使用针灸、中成药、手术治疗、西药疗法的医案不予收录。
, 百拇医药
1.3.3 中医证型 必须含有病性及病位两个方面的内容。医案内容中只含有病位(如“脾肾为病”),或只含有病性(如“实”、“虚”),不予以收录。
1.3.4 症状 除主症以外,必须有2个以上次要症状。
按照上述标准,本文共采集崩漏医案664例,发表时间为1972-2005年,患者就诊时间为1951-2003年。
2、方法
2.1 数据预处理
对后期数据分析需要的中药、中医证型、症状3个方面的数据进行预处理。对中药名称的选词主要参考《中华人民共和国药典》(2005版)、《中药大辞典》和《中华本草》;对中医证型的选词参考《中国中医药学主题词表》《中医诊断学》《中华人民共和国中医药行业标准一一中医病证诊断疗效标准》等书籍;对症状的选词参考《中国中医药学主题词表》《中医诊断学》《简明中医辞典》等书籍。
, 百拇医药
2.2 数据挖掘工具
应用WEKA软件进行数据挖掘。该软件由中国中医科学院周雪忠教授等人开发,使用Apriori算法进行药物、症状、药症和药证等关联规则的知识发现。
2.3 数据挖掘方法
从不同角度对中药、中医证型、症状三部分内容进行处理,通过对“中药+中药”、“中药+症状”、“中药+证型”3种高频集的分析,获得更多的关联关系。
参考以往研究和多次运行预实验的结果,设定最小支持度为5%,最小置信度为40%。对所得挖掘结果筛选出置信度最高的10个项目集和支持度最高的10个项目集进行分析。
3、结果
对高频中药组、高频症状+中药组、高频证型+中药组3种高频集的挖掘结果进行分析,并与传统知识进行比对。
, http://www.100md.com
3.1 高频中药组与传统理论比对
表1显示,在治疗崩漏医案中,支持度为前10名的药对在传统文献中大部分找到了相应理论依据。例如排名第1位的项集白芍→当归,在《常用中药配对与禁忌》中记载“白芍补血敛阴,柔肝和营。当归补血活血,止痛。白芍酸收性和,守而不走;当归辛香性开,走而不守。二药配伍,一守一行,一开一合,动静结合,补血而不滞血,活血而不耗血。合用共奏养血补血、养肝止痛之功”。但是排名第9位的项集地黄→当归未找到相关的文献描述。
在置信度前10名的药对中,有9对在传统文献中得到认可。例如地骨皮→地黄,在《现代中药炮制手册》驯中记载“地骨皮甘寒清热,凉血止血,生津止渴,生地黄味甘苦性寒,功善清热凉血,又能养阴生津,二药配对,共奏清热凉血、养阴生津之功”。但是排名第9位的药对五灵脂→当归未在传统文献中找到依据。
3.2 高频症状+中药组挖掘结果与传统理论比对
, 百拇医药
表2显示,支持度为前10名的项集在传统文献中大部分都可以找到相应的理论依据。例如排在第1位的项集当归→经血量多,在《中药学》中记载“月经量多有实有虚,实为血热迫血妄行,虚者多为气虚不摄,冲任不调所致,当归多用于此证属虚者”。排名第3位的项集白芍→经血量多,在《中华临床中药学》中记载“白芍养血敛阴,调和气血,可用于妇人冲任损伤不能制约经血,经血非时妄行,或量多如注,或淋漓不断”。数据挖掘结果与传统理论基本相符。
置信度为前10名项集的大部分也找到了相关论述。例如排名第3位的项集五灵脂→腹痛,在《中药学》中记载“五灵脂苦咸温通疏泄,专入肝经血分,长于通利血脉散瘀止痛,为治血瘀诸痛之要药,如胸胁脘腹刺痛,痛经,经闭,产后瘀滞腹痛,骨折肿痛均可施用”。而排名第1位的项集五灵脂→经血有块,虽然分别找到了各自相关内容的描述,但两者之间明显的相关描述未有明显的理念依据。在《中药学》中记载“五灵脂:苦咸甘温,归肝经,功效是通利血脉,活血止痛,散瘀止血”,出现了活血、散瘀的表述;而在《中医诊法学》中对经血有块的描述为“经血有块:主症是气滞血瘀,或寒凝血瘀或气虚血瘀,或热结血瘀”,出现了4次“血瘀”。
, http://www.100md.com
3.3 高频证型+中药组挖掘结果与传统理论比对
表3显示,支持度、置信度前10名的项集全部在传统文献中找到了相应的理论依据。例如支持度排在第1位的项集热→地黄,在《中药学》中记载“地黄性甘苦寒,清热凉血,养阴生津”;置信度排名第1位的桃仁→瘀,在《中药学》中记载“桃仁苦甘平,活血祛瘀,润肠通便,消痈排脓,止咳平喘”。
4、结论
4.1 有效结果
对664例崩漏医案信息支持度和置信度排名前10位的数据进行分析,中药高频组与传统理论的符合率是88.9%,中药+症状高频组的符合率是45.0%,中药+证型高频组的符合率是100%。说明数据挖掘结果与传统理论大体一致,可以看出关联分析技术在妇科医案的规律发现中的合理有效性,数据挖掘信息处理技术可作为传统知识总结的补充,值得进一步研究。
, http://www.100md.com
4.2 产生新知
本次崩漏数据挖掘结果发现一些在传统理论中未直接表述,但在临床处方中经常被应用的规律。例如在高频中药组中的地黄→当归、五灵脂→当归,这两组对药在临床上为医师广为应用,但在现有文献中未找到这两组药物成对使用的理论依据。因此,可以认为这些规律是医师从主观意识上难以察觉到的新知。
4.3 临床参考
本文探讨了中药配伍、高频症状+中药组、高频证型+中药组三种关系,这些关系都是医师在临床上比较关注的方面。例如,在治疗崩漏的瘀证时,教科书中记载的活血化瘀常用药有28个,活血化瘀方剂有8首,如果没有丰富的临证经验,在用药选择上会存在一定困难。而本项研究发现,专家在治疗瘀证时93%都用了桃仁,这些规律可为医师在临证处方时提供用药参考。
本项研究用定量的数理关系把“药证症”相连接,可以更科学地指导临床和科研工作,发现的结果可以为临床医师提供处方参考。, http://www.100md.com(杨阳 崔蒙 田野 王静 亢力 李萌 连超杰 张晶 奚怀平 李园白)
参见:首页 > 医疗版 > 疾病专题 > 妇产科 > 月经失调(月经病) > 功能失调性子宫出血