多元统计分析在中药质量控制中的应用和思考(1)
[摘要] 中药质量控制的研究一直是中医药发展的热点和难点,也是制约中药走向现代化和国际化的关键问题之一。多元统计分析是适合中医药特点的分析方法,在中药质量控制研究中得到了广泛的应用。运用多元统计分析对中药质量控制研究中出现的多指标、多变量且彼此之间存在着一定相关性的数据进行分析,可发现隐藏在其中的规律或数据间的关系,从而服务于决策,以实现中药质量的有效评价。该文就多元统计分析在中药质量控制中的应用进行了综述,为其进一步研究提供了依据。
[关键词] 多元统计分析;中药;质量控制
中药是指在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质,包括中药材、中药饮片和中成药等。中药是我国中医药文化的瑰宝,并以资源丰富、疗效独特和副作用少等优势成为国内外关注的焦点。但长久以来,原始、单一的中药质量控制方法,一直制约着中药质量的提高,随着科学技术的发展以及各种新仪器的问世,应用于中药质量控制的方法和手段也不断增加,从原来单一的质控指标发展到现在的多质控指标,这使得中药质量控制标准全面提高[1]。但这些构成指标体系的多个指标又各有侧重地解释着该中药的质量,其间必然存在着多重共线性。比如,指纹图谱在改变单一指标性成分评价中药质量所明显存在片面局限性的同时,也暴露出它自身的问题,即在表现众多成分的指纹峰中,什么是重点?哪些峰是可以放弃的?现实的要求是既不能“片面”,但也不能“一把抓”[2]。如果用一元统计方法一次只能分析一个指标,分析多个指标时就会忽视了各指标之间存在的相关性,分析的结果不能客观全面地反映情况。多元统计分析[3-7]能在不损失信息的情况下,通过变换和构造模型,剔除指标间相互制约的成分,寻找一个简单综合指标,将这些指标反映的内容综合起来,使复杂数据简单化。且有文献报道,多元统计分析能在一定程度上达到数据挖掘的目的,同时它的一些思想和功能也能在数据挖掘的数据收集、数据清理环节发挥作用[8]。因此运用多元统计分析对中药质控研究中出现的多指标、高维和大量统计数据且彼此之间相关的数据进行分析,可发现数据间的内在规律,以实现中药质量的有效控制。
, http://www.100md.com
1 多元统计分析的涵义
多元统计分析是同时分析和处理多组变量,从整体把握事件的特征和发生规律统计分析方法,其核心内容是总体参数估计的修正和统计推断,具体表现出来就是各类统计方法,如主成分分析、因子分析、聚类分析、判别分析和典型相关分析等[5]。多元统计分析应用于中药质量控制的研究有以下几种优势:①多指标性只有用相互关联的多个指标(即描述现象的多个方面)才能够对事物或现象的全貌有所了解,这是多元统计分析在中药质控研究多个指标的最大优点;②定量性多元统计分析就是用数学的方法来研究影响中药质量的多个指标之间相互依赖关系以及内在统计规律性的分析方法;③复杂性和数据计算量大等特点这是多元统计分析适宜于分析研究中药质控中出现的繁琐复杂数据的基础[9]。
2 多元统计方法在中药质量控制中的应用现状
多元统计分析广泛应用于经济管理、医学、教育、生物等诸多领域,其中以中医药为检索范围,在已检索到的运用各类统计方法的51 792篇文献中,包括多元统计方法的文献已达25 279篇,说明多元统计方法已在中医药研究中得到了广泛应用。而统计学理论和中医药理论客观存在的相合性,也说明了多元统计方法在中医药研究中的应用不仅是可行的,也是科学的[10]。运用多元统计分析对影响中药质量的多方面因素进行综合分析和评价,以实现对中药质量更准确,更全面地控制。下面分别介绍几种主要的多元统计分析方法近年来在中药质控中的应用。
, 百拇医药
2.1 主成分分析 主成分分析的定义为利用数学降维方法,寻找新变量替代旧变量群,新变量之间互不干涉,可独立进行分布统计,是一种将多数相关变量群替换成少数无关变量的方法[5]。主成分分析法能过滤虚假信息,减少无关指标的影响,已普遍应用于中药质量标准研究数据的统计分析中,以确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选[11]。王劭华等[12]采用主成分分析对24批不同产地车前子样品中的10个共有峰面积进行分析,以累计方差贡献率达86.45%选取3个主成分,由主成分综合得分排序可知,综合品质较好的车前子品种为大车前子和平车前子,其中综合品质最好的为江西吉水婆婆庙产的大车前子;根据车前子主成分投影图可以将车前和平车前种子与其他品种车前种子区分开来。王琴等[13]应用主成分分析对不同地区枸杞中多糖和金属元素之间的相关性进行分析,以累积方差贡献率达88.181%筛选出3个主成分,结果表明多糖和常量金属元素钙(Ca),镁(Mg),钠(Na),钾(K)是影响枸杞质量的重要因素,微量元素铜(Cu),锌(Zn),铁(Fe)也是不可忽视的因素;其主成分得分可用于不同产地枸杞子质量的综合评价,为以后不同产地枸杞的开发利用奠定了基础。
, 百拇医药
2.2 因子分析 因子分析又称为探索性因素分析,是根据相关性大小把原始变量进行分组,使同组内变量之间的相关性较高,而不同组变量间的相关性较低[3-4]。因子分析也是利用主成分分析的降维思想,可看作是对主成分分析的推广和发展,但是其因子分析对于所研究的问题是根据原始变量的信息进行重新组合,以试图用最少个数的不可测的所谓公共因子的线性函数和通过旋转使得来的新变量对每个原始变量更具有可解释性。朵兴红[14]采用因子分析对党参、细辛等7种道地药材中Ca,Mg,锰(Mn),Cu,Fe,Zn 6种微量元素进行分析,以方差的贡献率大于99.75%提取2个主因子,分析结果表明这6种微量元素均对防治心脑血管疾病有一定的疗效,为微量元素与中药功效关系的研究提供了科学依据。多杰扎西等[15]采用因子分析对11个不同产地枸杞子中Zn,Cu,Fe,Mn等微量元素之间的关系进行研究,以累计方差达92.236%提取3个主因子,结果表明第一主因子与变量Zn和Mn有高的相关性,是枸杞子中起络合作用的微量元素,也是决定枸杞子质量的基本微量元素;第二主因子在变量Cu元素上有最高的载荷系数,是通过影响生物体内的酶、激素、维生素等生物活性物质,而发挥药效作用的微量元素;第三主因子在Fe元素上有最高的载荷系数,是在氧化还原等许多代谢中起到重要作用的微量元素,这3个主因子能够反映枸杞子中微量元素的分布特征;不同产地枸杞子的综合评价结果,与实际分类和质量的情况基本相符,如列于质量好的第一类、综合因子得分分列第二的宁夏某枸杞研究所,其培植生产的枸杞子质量高,一直起到行业示范作用。, 百拇医药(刘娜 李军 李宝国)
[关键词] 多元统计分析;中药;质量控制
中药是指在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质,包括中药材、中药饮片和中成药等。中药是我国中医药文化的瑰宝,并以资源丰富、疗效独特和副作用少等优势成为国内外关注的焦点。但长久以来,原始、单一的中药质量控制方法,一直制约着中药质量的提高,随着科学技术的发展以及各种新仪器的问世,应用于中药质量控制的方法和手段也不断增加,从原来单一的质控指标发展到现在的多质控指标,这使得中药质量控制标准全面提高[1]。但这些构成指标体系的多个指标又各有侧重地解释着该中药的质量,其间必然存在着多重共线性。比如,指纹图谱在改变单一指标性成分评价中药质量所明显存在片面局限性的同时,也暴露出它自身的问题,即在表现众多成分的指纹峰中,什么是重点?哪些峰是可以放弃的?现实的要求是既不能“片面”,但也不能“一把抓”[2]。如果用一元统计方法一次只能分析一个指标,分析多个指标时就会忽视了各指标之间存在的相关性,分析的结果不能客观全面地反映情况。多元统计分析[3-7]能在不损失信息的情况下,通过变换和构造模型,剔除指标间相互制约的成分,寻找一个简单综合指标,将这些指标反映的内容综合起来,使复杂数据简单化。且有文献报道,多元统计分析能在一定程度上达到数据挖掘的目的,同时它的一些思想和功能也能在数据挖掘的数据收集、数据清理环节发挥作用[8]。因此运用多元统计分析对中药质控研究中出现的多指标、高维和大量统计数据且彼此之间相关的数据进行分析,可发现数据间的内在规律,以实现中药质量的有效控制。
, http://www.100md.com
1 多元统计分析的涵义
多元统计分析是同时分析和处理多组变量,从整体把握事件的特征和发生规律统计分析方法,其核心内容是总体参数估计的修正和统计推断,具体表现出来就是各类统计方法,如主成分分析、因子分析、聚类分析、判别分析和典型相关分析等[5]。多元统计分析应用于中药质量控制的研究有以下几种优势:①多指标性只有用相互关联的多个指标(即描述现象的多个方面)才能够对事物或现象的全貌有所了解,这是多元统计分析在中药质控研究多个指标的最大优点;②定量性多元统计分析就是用数学的方法来研究影响中药质量的多个指标之间相互依赖关系以及内在统计规律性的分析方法;③复杂性和数据计算量大等特点这是多元统计分析适宜于分析研究中药质控中出现的繁琐复杂数据的基础[9]。
2 多元统计方法在中药质量控制中的应用现状
多元统计分析广泛应用于经济管理、医学、教育、生物等诸多领域,其中以中医药为检索范围,在已检索到的运用各类统计方法的51 792篇文献中,包括多元统计方法的文献已达25 279篇,说明多元统计方法已在中医药研究中得到了广泛应用。而统计学理论和中医药理论客观存在的相合性,也说明了多元统计方法在中医药研究中的应用不仅是可行的,也是科学的[10]。运用多元统计分析对影响中药质量的多方面因素进行综合分析和评价,以实现对中药质量更准确,更全面地控制。下面分别介绍几种主要的多元统计分析方法近年来在中药质控中的应用。
, 百拇医药
2.1 主成分分析 主成分分析的定义为利用数学降维方法,寻找新变量替代旧变量群,新变量之间互不干涉,可独立进行分布统计,是一种将多数相关变量群替换成少数无关变量的方法[5]。主成分分析法能过滤虚假信息,减少无关指标的影响,已普遍应用于中药质量标准研究数据的统计分析中,以确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选[11]。王劭华等[12]采用主成分分析对24批不同产地车前子样品中的10个共有峰面积进行分析,以累计方差贡献率达86.45%选取3个主成分,由主成分综合得分排序可知,综合品质较好的车前子品种为大车前子和平车前子,其中综合品质最好的为江西吉水婆婆庙产的大车前子;根据车前子主成分投影图可以将车前和平车前种子与其他品种车前种子区分开来。王琴等[13]应用主成分分析对不同地区枸杞中多糖和金属元素之间的相关性进行分析,以累积方差贡献率达88.181%筛选出3个主成分,结果表明多糖和常量金属元素钙(Ca),镁(Mg),钠(Na),钾(K)是影响枸杞质量的重要因素,微量元素铜(Cu),锌(Zn),铁(Fe)也是不可忽视的因素;其主成分得分可用于不同产地枸杞子质量的综合评价,为以后不同产地枸杞的开发利用奠定了基础。
, 百拇医药
2.2 因子分析 因子分析又称为探索性因素分析,是根据相关性大小把原始变量进行分组,使同组内变量之间的相关性较高,而不同组变量间的相关性较低[3-4]。因子分析也是利用主成分分析的降维思想,可看作是对主成分分析的推广和发展,但是其因子分析对于所研究的问题是根据原始变量的信息进行重新组合,以试图用最少个数的不可测的所谓公共因子的线性函数和通过旋转使得来的新变量对每个原始变量更具有可解释性。朵兴红[14]采用因子分析对党参、细辛等7种道地药材中Ca,Mg,锰(Mn),Cu,Fe,Zn 6种微量元素进行分析,以方差的贡献率大于99.75%提取2个主因子,分析结果表明这6种微量元素均对防治心脑血管疾病有一定的疗效,为微量元素与中药功效关系的研究提供了科学依据。多杰扎西等[15]采用因子分析对11个不同产地枸杞子中Zn,Cu,Fe,Mn等微量元素之间的关系进行研究,以累计方差达92.236%提取3个主因子,结果表明第一主因子与变量Zn和Mn有高的相关性,是枸杞子中起络合作用的微量元素,也是决定枸杞子质量的基本微量元素;第二主因子在变量Cu元素上有最高的载荷系数,是通过影响生物体内的酶、激素、维生素等生物活性物质,而发挥药效作用的微量元素;第三主因子在Fe元素上有最高的载荷系数,是在氧化还原等许多代谢中起到重要作用的微量元素,这3个主因子能够反映枸杞子中微量元素的分布特征;不同产地枸杞子的综合评价结果,与实际分类和质量的情况基本相符,如列于质量好的第一类、综合因子得分分列第二的宁夏某枸杞研究所,其培植生产的枸杞子质量高,一直起到行业示范作用。, 百拇医药(刘娜 李军 李宝国)