当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2015年第3期
编号:12617926
基于潜在语义分析的中药分类技术(2)
http://www.100md.com 2015年3月1日 中国中医药信息 2015年第3期
     对上述中药药材的光谱进行聚类分析,每种药材100个样本,共4800个光谱(以补血类药物当归为例,100个当归样本的近红外光谱图见图1),检验4类药物是否具备明显的光谱特征差异。对光谱数据直接采用K-Means聚类方法将药材分为4类。原始光谱分类的正确率仅为10.83%。采用潜在语义分析方法对数据分析后采用K-Means聚类,分类正确率为31.08%,比直接采用原始数据分类正确率高,但仍不理想。分析分类正确率低的原因,发现药材的不同样本峰位存在漂移,有些甚至不出现峰值。为简化分析难度,避开不同样本间的差异问题,我们将每种药材取1个代表性数据进行分析。

    3.1 代表性光谱的选择

    如果只采用1个样本数据,可以使用平均值或中位值作为代表。由于植物成分不均一,存在异常样本,鉴于异常样本会在平均时引入较大误差,我们采用中位值作为数据代表。PCA可以找出光谱的中位值,还可根据样本与中心位置的距离大小剔除异常数据。因此,我们运用Matlab编程,对每种药材的100个光谱数据进行PCA ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 3983 字符