基于模糊C均值聚类算法的蒙医方剂类别划分方法研究(2)
1 模糊C均值聚类算法FCM算法即众所周知的ISODATA模糊聚类算法,是通过隶属度即隶属于某类程度实现聚类的一种算法,1973年由Bezdek提出,是一种基于划分的聚类算法。它的主旨是使被划分到同一簇的对象间相似度最大,而不同簇间相似度最小。该算法是在HCM算法硬性数据划分的基础上改进的一种柔性模糊划分。核心思想为把n个一维向量xi(i=1,2,…,n)分为C个模糊组,并求每组的聚类中心,使非相似性指标的价值函数达到最小。FCM算法与HCM算法的主要区别在于其类的划分原则是模糊的,每个数据点属于哪一个类并不明确,而是用[0,1]区间的一个模糊值来确定属于各个类的程度来表示。隶属度是经过归一化的,一个数据集的隶属度总和等于1:
①
FCM算法的价值函数/目标函数一般化形式为:
②
其中uij属[0,1];ci为模糊组i的聚类中心, 为第i个聚类中心与第j个数据点间的欧几里德距离;且 是一个加权指数。
构造如下新目标函数,构建最小值的必要条件:
③
这里λj(j=1,2,…,n)是公式①的n个约束式的拉格朗日乘子。对所有输入参量求导,使公式②达到最小的必要条件为公式④和公式⑤:
④
⑤
FCM算法分析步骤:步骤1:构建满足公式①的随机隶属度矩阵U。步骤2:计算每个类的中心点 ......
您现在查看是摘要页,全文长 5440 字符。