从定性描述到定量分析贝叶斯网络协助中医诊断规范化
辨证论治是中医学的特色和精髓。然而,传统的中医辨证方法经验色彩浓厚,并受到医师水平和学术流派等多方面因素的影响,存在主观性强和可重复性差等诸多不足,严重束缚了中医学的推广与发展,而把中医学从依赖于经验的不精确状态发展为定量的精确科学也就成酥幸较执目凸垡蟆4舜斡泄匮д哂?br>用数据挖掘技术开展定量诊断研究,有助于实现中医辨证从定性描述到定量分析的转变,因此,这种尝试从一开始就令人期待。
——编者按
日前,由浙江大学药物信息学研究所与中国中医研究院西苑医院共同进行的一项国家自然基金项目研究显示,利用贝叶斯网络的相关技术,可以从临床数据中发现血瘀证的关键症状,通过定量计算这些症状对诊断的贡献度,则可以建立血瘀证的诊断模型。这项研究也说明该方法在中医定量诊断中具有良好的应用前景。
中医定量诊断研究始于20世纪80年代,是通过借鉴循证医学和数理统计等学科的思路和方法,开展症证计量研究和证候诊断模型研究。后者是当前中医定量诊断研究的核心内容,目前主要采用判别分析和回归分析等多元统计技术建立辨证方法和模型。这些研究在中医诊断的规范化和标准化方面做了很多有益的尝试,并在血瘀证诊断和中风诊断等重大证候的诊断上进行了较为深入的研究。然而,中医证候涉及的因素众多,且其间存在复杂的非线性关系,这些复杂特性给中医辨证的定量化和标准化带来了很大的挑战。
, http://www.100md.com
数据挖掘是近年来随着人工智能和数据库技术的交叉融合而兴起的边缘学科。数据挖掘技术在中医药领域具有良好的应用前景,将其应用于中医诊断,不仅可以从临床诊断数据中辨析证候与症状间的复杂关系,总结归纳中医专家的辨证规律并模拟其诊断推理过程,还可能发现客观有用的新知识以丰富专家经验和中医理论。贝叶斯网络是一种引人注目的数据挖掘技术,近年来已逐渐成为解决不确定性知识表达与推理问题的主流方法。
研究人员将醋灾泄幸窖芯吭何髟芬皆旱?84例血瘀证临床诊断病例(其中诊断为血瘀证的206例,非血瘀证的278例)作为原始病例。原始病例数据包括宏观症状和理化检测指标等52个症状,剔除缺失值较多的症状后得到30个症状,这些症状的名称和可能的状态再剔除仍旧含有缺失值的样本,得到474例数据完备的样本,其中诊断为血瘀证的197例,非血瘀证的277例。研究人员采用基于信息论的贝叶斯网络结构学习算法学习这30个变量间的因果关系,找到与“是否血瘀”直接相关的症状。
研究人员发现,利用该学习算法得到这30个变量间的因果关系图,从中得到“是否血瘀”的直接相关症状(称之为“关键症状”)为“疼痛程度、肢体麻木、舌质青紫、舌体瘀斑、舌脉曲张、口唇暗红、脉涩”。而且还发现了症状间的相互关系,包括“舌质青紫”与“舌脉曲张”,“肢体麻木”、“舌体瘀斑”与“舌质青紫”,“舌体瘀斑”与“口唇暗红”,“疼痛程度”与“口唇暗红”间的相关关系。因此,根据这7个症状可以建立“是否血瘀”诊断的简单贝叶斯分类器模型,在计算出各症状以“是否血瘀”为条件时的条件概率后,再用信息熵分析法计算得到各症状与“是否血瘀”间的互信息和诊断贡献度,发现“舌脉曲张”的贡献度最大,“舌质青紫”、“舌体瘀斑”、“口唇暗红”和“脉涩”的贡献度依次降低,“肢体麻木”和“疼痛程度”的诊断贡献度则明显小于其他症状。这也与中医经验相符。
, 百拇医药
研究员又采用10-交叉验证方法考察了基于关键症状与基于全部症状的简单贝叶斯分类器的诊断效果,从结果可以看出,相对于基于全部症状的诊断模型,基于关键症状的诊断模型性能有显著提高,这表明所发现的关键症状对血瘀证诊断是有意义的。衔獾恼锒献既仿室菜得骷虻ケ匆端狗掷嗥魇屎嫌诮饩稣饫?br>诊断问题。
研究人员指出,通过以上研究可以证实,贝叶斯网络技术适合于解决中医定量诊断问题。它可以揭示众多症状间以及症状与证候间的复杂关系,从中发现证候的主要症状和次要症状,并定量确定其诊断价值,有助于确定证候诊断的标准和规范。而且建立的证候诊断模型以概率形式给出诊断结果,能有效辅助专家做出决策。
(王学伟 瞿海斌 王阶)
相关链接:
贝叶斯网络是表示变量间概率关系的图模型,由网络结构和一组概率集合组成。结构模型是个有向无环图,其中的节点表示待考察的指标或变量,有向边表示变量间的概率相关关系;概率集合则给出了每个变量以其父节点为条件时的条件概率。
, 百拇医药
贝叶斯网络可以进行知识发现。新近发展起来的贝叶斯网络学习技术能够通过数据分析自动创建贝叶斯网络,从数据中发现变量间的因果关系,并用概率定量表示这些因果关系的强度。其从数据出发的特性可能发现新的领域知识,丰富对领域对象的认识。而发现的因果关系不仅有助于深入理解领域对象间的内在联系,还有助于对外部干预措施可能产生的效应进行预测分析。除了发现因果关系之外,贝叶斯网络模型的另一大用途是运用概率推理进行诊断预测。这样就可以方便地辅助专家做出定量诊断。当数据量较少或获取代价高昂时,可以方便地利用专家经验对学习到的贝叶斯网络模型的结构和概率进行修正,从而提高贝叶斯网络模型诊断的准确性。
简单贝叶斯分类器(NBC)是一类诊断效果很好的简化贝叶斯网络模型,这种模型在诊断疾病时,先从病例数据中学习得到每鲋⒆丛诿恐旨膊±啾鹣碌奶?br>件概率,再根据待诊断病例的症状取值情况,应用贝叶斯定理计算每种类别的后验概率,最后把后验概率最大的疾病类别作为该病例的诊断结果。, 百拇医药(王学伟;瞿海斌;王阶)
——编者按
日前,由浙江大学药物信息学研究所与中国中医研究院西苑医院共同进行的一项国家自然基金项目研究显示,利用贝叶斯网络的相关技术,可以从临床数据中发现血瘀证的关键症状,通过定量计算这些症状对诊断的贡献度,则可以建立血瘀证的诊断模型。这项研究也说明该方法在中医定量诊断中具有良好的应用前景。
中医定量诊断研究始于20世纪80年代,是通过借鉴循证医学和数理统计等学科的思路和方法,开展症证计量研究和证候诊断模型研究。后者是当前中医定量诊断研究的核心内容,目前主要采用判别分析和回归分析等多元统计技术建立辨证方法和模型。这些研究在中医诊断的规范化和标准化方面做了很多有益的尝试,并在血瘀证诊断和中风诊断等重大证候的诊断上进行了较为深入的研究。然而,中医证候涉及的因素众多,且其间存在复杂的非线性关系,这些复杂特性给中医辨证的定量化和标准化带来了很大的挑战。
, http://www.100md.com
数据挖掘是近年来随着人工智能和数据库技术的交叉融合而兴起的边缘学科。数据挖掘技术在中医药领域具有良好的应用前景,将其应用于中医诊断,不仅可以从临床诊断数据中辨析证候与症状间的复杂关系,总结归纳中医专家的辨证规律并模拟其诊断推理过程,还可能发现客观有用的新知识以丰富专家经验和中医理论。贝叶斯网络是一种引人注目的数据挖掘技术,近年来已逐渐成为解决不确定性知识表达与推理问题的主流方法。
研究人员将醋灾泄幸窖芯吭何髟芬皆旱?84例血瘀证临床诊断病例(其中诊断为血瘀证的206例,非血瘀证的278例)作为原始病例。原始病例数据包括宏观症状和理化检测指标等52个症状,剔除缺失值较多的症状后得到30个症状,这些症状的名称和可能的状态再剔除仍旧含有缺失值的样本,得到474例数据完备的样本,其中诊断为血瘀证的197例,非血瘀证的277例。研究人员采用基于信息论的贝叶斯网络结构学习算法学习这30个变量间的因果关系,找到与“是否血瘀”直接相关的症状。
研究人员发现,利用该学习算法得到这30个变量间的因果关系图,从中得到“是否血瘀”的直接相关症状(称之为“关键症状”)为“疼痛程度、肢体麻木、舌质青紫、舌体瘀斑、舌脉曲张、口唇暗红、脉涩”。而且还发现了症状间的相互关系,包括“舌质青紫”与“舌脉曲张”,“肢体麻木”、“舌体瘀斑”与“舌质青紫”,“舌体瘀斑”与“口唇暗红”,“疼痛程度”与“口唇暗红”间的相关关系。因此,根据这7个症状可以建立“是否血瘀”诊断的简单贝叶斯分类器模型,在计算出各症状以“是否血瘀”为条件时的条件概率后,再用信息熵分析法计算得到各症状与“是否血瘀”间的互信息和诊断贡献度,发现“舌脉曲张”的贡献度最大,“舌质青紫”、“舌体瘀斑”、“口唇暗红”和“脉涩”的贡献度依次降低,“肢体麻木”和“疼痛程度”的诊断贡献度则明显小于其他症状。这也与中医经验相符。
, 百拇医药
研究员又采用10-交叉验证方法考察了基于关键症状与基于全部症状的简单贝叶斯分类器的诊断效果,从结果可以看出,相对于基于全部症状的诊断模型,基于关键症状的诊断模型性能有显著提高,这表明所发现的关键症状对血瘀证诊断是有意义的。衔獾恼锒献既仿室菜得骷虻ケ匆端狗掷嗥魇屎嫌诮饩稣饫?br>诊断问题。
研究人员指出,通过以上研究可以证实,贝叶斯网络技术适合于解决中医定量诊断问题。它可以揭示众多症状间以及症状与证候间的复杂关系,从中发现证候的主要症状和次要症状,并定量确定其诊断价值,有助于确定证候诊断的标准和规范。而且建立的证候诊断模型以概率形式给出诊断结果,能有效辅助专家做出决策。
(王学伟 瞿海斌 王阶)
相关链接:
贝叶斯网络是表示变量间概率关系的图模型,由网络结构和一组概率集合组成。结构模型是个有向无环图,其中的节点表示待考察的指标或变量,有向边表示变量间的概率相关关系;概率集合则给出了每个变量以其父节点为条件时的条件概率。
, 百拇医药
贝叶斯网络可以进行知识发现。新近发展起来的贝叶斯网络学习技术能够通过数据分析自动创建贝叶斯网络,从数据中发现变量间的因果关系,并用概率定量表示这些因果关系的强度。其从数据出发的特性可能发现新的领域知识,丰富对领域对象的认识。而发现的因果关系不仅有助于深入理解领域对象间的内在联系,还有助于对外部干预措施可能产生的效应进行预测分析。除了发现因果关系之外,贝叶斯网络模型的另一大用途是运用概率推理进行诊断预测。这样就可以方便地辅助专家做出定量诊断。当数据量较少或获取代价高昂时,可以方便地利用专家经验对学习到的贝叶斯网络模型的结构和概率进行修正,从而提高贝叶斯网络模型诊断的准确性。
简单贝叶斯分类器(NBC)是一类诊断效果很好的简化贝叶斯网络模型,这种模型在诊断疾病时,先从病例数据中学习得到每鲋⒆丛诿恐旨膊±啾鹣碌奶?br>件概率,再根据待诊断病例的症状取值情况,应用贝叶斯定理计算每种类别的后验概率,最后把后验概率最大的疾病类别作为该病例的诊断结果。, 百拇医药(王学伟;瞿海斌;王阶)