GIS在血吸虫病防治应用中的几种图象分割方法的比较
作者:张文庆 王公昊
单位:中国预防医学科学院信息中心 北京 100050
关键词:
实用寄生虫病杂志990114 血吸虫病是一种严重危害人体健康的地方病,该病的流行与地理要素密切相关。其中间宿主-钉螺孳生环境受土壤、植被、水和气候区域的制约。地理信息系统(GIS)现已开始应用于血吸虫病防治、研究资料的管理及分析处理。GIS在处理血防资料时把有关疾病传播的生物学数据与地理、生态环境因素结合起来,构成二维或三维图象,并对其研究,阐明其分布规律及传播特征。该应用的一个关键技术过程是图象分割,即把图象分割成具有某种意义的部分。它是识别特征对象不可缺少的处理过程,旨在突出目标,帮助人和机器对图象进一步分析和处理,增强人对图象的理解力。本文讨论几种较新的区域分割方法。
1 阈值法中阈值设置的新方法[1,2] 阈值处理是区域分割的基本方法,关键在于自动设置最佳阈值。以下讨论四种阈值设置的方法。①直方图极小值法 本方法是阈值设置常用的基本方法,它将阈值定位于两峰间的极小值点。该点在直方图相对容易确定。该方法的缺点:一是当两峰间没有足够分离,并严重交迭时,找极小值几乎不可能;其次,当直方图中两峰尺寸相差悬殊,或两峰间有多个极小值时,确定最佳极小值点很困难。②最小面积灵敏度法 本法使特征目标的面积在所定阈值点的变化率最小。即:阈值T不同,目标面积A也不同,当dA/dT最小时,此处的T即为阈值。确定阈值的方法:计算假定阈值两边面积的变化,并将它们的绝对值相加,当得到最小值时,该点即为所寻找的阈值点。③最小周长灵敏度法 设置不同的阈值,得到目标的边界周长也不同。当目标边界周长的变化率在某假定阈值点处最小时,该假定点即为最佳阈值点。它相当于求dL/dT最小值处的T值,式中L为边界周长。阈值的变化使边缘的象素亮度在两极端之间变化,从而产生“噪声”或不规则边界。用这种方法能产生最光滑的边界。本法要求特征物的边缘比较光滑。可以用简便的方法来计算周长,即计数扫描时灰度在阈值两边变化的次数。用以上三种阈值设置方法对四种特征(□、○、Ⅲ、☆)进行处理,得到的结果比较如下:a.不论用那种方法,越是规则的特征(矩形、圆),测得的面积和周长值的波动越小。波动近似地与周长成正比。b.在重复测量中,直方图极小值法所得结果的波动最大,而最小周长灵敏度法所得结果的波动最小。④固定百分率法 当特征灰度范围的一个界固定在极端(白或黑)时,另一个界设置在占图象总面积固定百分比的那个点上的方法,叫固定百分率法。当对象物的大小能预先给定,对象物的面积能大体上限定在某一范围时,此法更合适。当光从侧面照射到目标上时,用这种方法能产生很好的效果。用梯度法等进行边缘检出后,当边界为最白时,选一个固定灰度作阈值往往得不到连续的效果。这是因为随着边界方向的变化,梯度的绝对值也随之轻微地变化。例如,当光从侧面照射到目标上时,用这种方法能产生很好的效果。
, 百拇医药
2 多值连续阈值法[2,3] GIS在流行病学的应用中,常常会碰到特征对象分类不清的情况,即难以从形态学上分割目标,或目标精确边界的检出。此时,可以用多值连续阈值法巧妙解决不同目标类别间用肉眼也难以精确分开的棘手问题。多值连续阈值法的设置有两种:①阈值t(i)=t(0)+dt(i),i=1,2,…n。t(0)是通过预先对单个目标的分析得到的,dt(i)是设置的一组常数值。例如:当n=4时,dt(i),i=1,…4分别为-30,0,10,30。这些常数一经确定,在整个分类过程中就不改变。用不同的阈值分割出不同的对象物,进行特征提取,如几何特征、光密度特征和结构特征,根据这些特征进行目标物的分类。②在直方图中找出除背景灰度外的最小和最大灰度级,并在此范围内将灰度分成n等份,然后分割出灰度介于t(i)和t(i-1)之间的区域[对i=1,t(i-1)为最小灰度级]。提取几何特征、光密度特征和结构特征,并根据这些特征分类。
3 灰度级“丛”提取法[3] 设Pf(z,w)表示w灰度级的象元点出现在z灰度级的象元点邻域中的频率,这是图象f的灰度级间的一种联合概率密度。如果图象f有k个量化级,则Pf(z,w)为一个k*k的对称矩阵。设Pij是出现在zi灰度级象元的邻域中zj灰度的象元数,利用这些向量可以确定各个不同灰度级之间的“接近程度”。当归一化互相关系数趋近于1时,表示灰度zi和zj是密切相关的。根据这种“接近程度”数值在图象f中找出一个灰度级“丛”,它们是区域中的象元互相接近的灰度级集合。这个“丛”就有可能是由图中出现的特定类型的物体或区域所引起的。这样的物体,即使不占任何特定的灰度级范围,但可采用在灰度级中具有特定的邻近象元点组合来表征。围绕那些所选定的点的四周上的点,这些点上的频率向量接近于这个“丛”,因为它们是高度相关的。所以,就有可能以此来分割图象,提取目标。这种方法并不是根据它本身的灰度值选择象元点,而是根据它与邻近象元灰度级间的互相关向量。因此,它能很好地区别出半黑半白的图象和黑白相间的噪声图。前者可以在黑、白区域里找到“丛”;而后者,对所有的点可能有相同的邻点间互相关向量,而找不到“丛”。
, 百拇医药
4 复杂图象中突出目标、除去背景的一种方法[4] 对一些复杂图象中的对象物测量、计数等,仅靠设置单一的阈值不能很好地除去背景,而对原图象进行变换,对得到的众多图象进行结合-图象中对应象素的灰度级的加、减,就可除去背景、保留对象物。以对象物为低灰度级的图象为例,算法流程如图所示。
这种方法的缺点有二:一是使相对窄小灰度范围的大目标相对地变小;其二是一些在最初的二值化中没有去除的背景,如果在扩大阶段不能被特征物所代替,就会保留下来。
5 交迭目标的一种分割方法[5] 在图象识别中,如何分割交迭目标一直是一个难题,目标的交迭给形态学的分析、计数等带来了不便。下面介绍一种建立在二值图象和凸标准基础上的分割方法。
这种方法可以由以下几步实现:①设置整体图象阈值,将灰度图象转变成二值图象。②进行扫描,得到一个目标,并计算它凸外壳所占的面积。③计算凸标准A/H,其中,A为目标所占的面积,H为凸外壳所占的面积,并根据这个标准来判断目标的复杂程度:即当A/H≈1时,目标是凸的、孤立的;当A/H《1时,目标是复杂的,并由两个或多个目标交迭而成。④将复杂目标缩小K倍,直到所有接触的目标孤立为止。K值取决于A/H。⑤将每个孤立目标放大K倍。⑥将经放大的目标与原二值图象相加。⑦各目标孤立后,可进行面积、周长等的计算与计数。本方法的误差主要发生在图象边界,其原因是目标间的严重交迭。
, 百拇医药
随着图象处理技术的日益发展,区域分割的方法也不断改进。所有的区域分割方法都是与某种特定的研究目的相对应的,不可能找出一种统一的分割方法对所有的研究目的都具有最佳的分割效果。这从另一方面也说明了区域分割方法研究的必要性和复杂性。
6 参考文献
1 Poon SSS,et al.Cell recognition algorithms for the cell analyzer.IEEE/Ninth Annual Conference on the Engineering in Medicine and Biology Society 1997:1454-1456.
2 Reardon DM,et al.Automatic haematology:A comparative study of cell counting and sizing using aperture impedance and flow cytometric systems.Medical Laboratory Science 1997;44∶320-325.
, 百拇医药
3 John C.Russ,et al.Automatic discrimination of features in grey scale images.J Microscopy 1991;148(3)∶263-277.
4 Paul.J,McMilliam,et al.Minima equalization:A useful strategy in automatic processing of microscopic images.The Royal Microscopical Society 1994;127∶253-262.
5 Kenneth R.Diller,et al.Computer automated cell size and shape analysis in cryomicroscopy.The Royal Microscopical Society 1994;127∶209-219., 百拇医药
单位:中国预防医学科学院信息中心 北京 100050
关键词:
实用寄生虫病杂志990114 血吸虫病是一种严重危害人体健康的地方病,该病的流行与地理要素密切相关。其中间宿主-钉螺孳生环境受土壤、植被、水和气候区域的制约。地理信息系统(GIS)现已开始应用于血吸虫病防治、研究资料的管理及分析处理。GIS在处理血防资料时把有关疾病传播的生物学数据与地理、生态环境因素结合起来,构成二维或三维图象,并对其研究,阐明其分布规律及传播特征。该应用的一个关键技术过程是图象分割,即把图象分割成具有某种意义的部分。它是识别特征对象不可缺少的处理过程,旨在突出目标,帮助人和机器对图象进一步分析和处理,增强人对图象的理解力。本文讨论几种较新的区域分割方法。
1 阈值法中阈值设置的新方法[1,2] 阈值处理是区域分割的基本方法,关键在于自动设置最佳阈值。以下讨论四种阈值设置的方法。①直方图极小值法 本方法是阈值设置常用的基本方法,它将阈值定位于两峰间的极小值点。该点在直方图相对容易确定。该方法的缺点:一是当两峰间没有足够分离,并严重交迭时,找极小值几乎不可能;其次,当直方图中两峰尺寸相差悬殊,或两峰间有多个极小值时,确定最佳极小值点很困难。②最小面积灵敏度法 本法使特征目标的面积在所定阈值点的变化率最小。即:阈值T不同,目标面积A也不同,当dA/dT最小时,此处的T即为阈值。确定阈值的方法:计算假定阈值两边面积的变化,并将它们的绝对值相加,当得到最小值时,该点即为所寻找的阈值点。③最小周长灵敏度法 设置不同的阈值,得到目标的边界周长也不同。当目标边界周长的变化率在某假定阈值点处最小时,该假定点即为最佳阈值点。它相当于求dL/dT最小值处的T值,式中L为边界周长。阈值的变化使边缘的象素亮度在两极端之间变化,从而产生“噪声”或不规则边界。用这种方法能产生最光滑的边界。本法要求特征物的边缘比较光滑。可以用简便的方法来计算周长,即计数扫描时灰度在阈值两边变化的次数。用以上三种阈值设置方法对四种特征(□、○、Ⅲ、☆)进行处理,得到的结果比较如下:a.不论用那种方法,越是规则的特征(矩形、圆),测得的面积和周长值的波动越小。波动近似地与周长成正比。b.在重复测量中,直方图极小值法所得结果的波动最大,而最小周长灵敏度法所得结果的波动最小。④固定百分率法 当特征灰度范围的一个界固定在极端(白或黑)时,另一个界设置在占图象总面积固定百分比的那个点上的方法,叫固定百分率法。当对象物的大小能预先给定,对象物的面积能大体上限定在某一范围时,此法更合适。当光从侧面照射到目标上时,用这种方法能产生很好的效果。用梯度法等进行边缘检出后,当边界为最白时,选一个固定灰度作阈值往往得不到连续的效果。这是因为随着边界方向的变化,梯度的绝对值也随之轻微地变化。例如,当光从侧面照射到目标上时,用这种方法能产生很好的效果。
, 百拇医药
2 多值连续阈值法[2,3] GIS在流行病学的应用中,常常会碰到特征对象分类不清的情况,即难以从形态学上分割目标,或目标精确边界的检出。此时,可以用多值连续阈值法巧妙解决不同目标类别间用肉眼也难以精确分开的棘手问题。多值连续阈值法的设置有两种:①阈值t(i)=t(0)+dt(i),i=1,2,…n。t(0)是通过预先对单个目标的分析得到的,dt(i)是设置的一组常数值。例如:当n=4时,dt(i),i=1,…4分别为-30,0,10,30。这些常数一经确定,在整个分类过程中就不改变。用不同的阈值分割出不同的对象物,进行特征提取,如几何特征、光密度特征和结构特征,根据这些特征进行目标物的分类。②在直方图中找出除背景灰度外的最小和最大灰度级,并在此范围内将灰度分成n等份,然后分割出灰度介于t(i)和t(i-1)之间的区域[对i=1,t(i-1)为最小灰度级]。提取几何特征、光密度特征和结构特征,并根据这些特征分类。
3 灰度级“丛”提取法[3] 设Pf(z,w)表示w灰度级的象元点出现在z灰度级的象元点邻域中的频率,这是图象f的灰度级间的一种联合概率密度。如果图象f有k个量化级,则Pf(z,w)为一个k*k的对称矩阵。设Pij是出现在zi灰度级象元的邻域中zj灰度的象元数,利用这些向量可以确定各个不同灰度级之间的“接近程度”。当归一化互相关系数趋近于1时,表示灰度zi和zj是密切相关的。根据这种“接近程度”数值在图象f中找出一个灰度级“丛”,它们是区域中的象元互相接近的灰度级集合。这个“丛”就有可能是由图中出现的特定类型的物体或区域所引起的。这样的物体,即使不占任何特定的灰度级范围,但可采用在灰度级中具有特定的邻近象元点组合来表征。围绕那些所选定的点的四周上的点,这些点上的频率向量接近于这个“丛”,因为它们是高度相关的。所以,就有可能以此来分割图象,提取目标。这种方法并不是根据它本身的灰度值选择象元点,而是根据它与邻近象元灰度级间的互相关向量。因此,它能很好地区别出半黑半白的图象和黑白相间的噪声图。前者可以在黑、白区域里找到“丛”;而后者,对所有的点可能有相同的邻点间互相关向量,而找不到“丛”。
, 百拇医药
4 复杂图象中突出目标、除去背景的一种方法[4] 对一些复杂图象中的对象物测量、计数等,仅靠设置单一的阈值不能很好地除去背景,而对原图象进行变换,对得到的众多图象进行结合-图象中对应象素的灰度级的加、减,就可除去背景、保留对象物。以对象物为低灰度级的图象为例,算法流程如图所示。
这种方法的缺点有二:一是使相对窄小灰度范围的大目标相对地变小;其二是一些在最初的二值化中没有去除的背景,如果在扩大阶段不能被特征物所代替,就会保留下来。
5 交迭目标的一种分割方法[5] 在图象识别中,如何分割交迭目标一直是一个难题,目标的交迭给形态学的分析、计数等带来了不便。下面介绍一种建立在二值图象和凸标准基础上的分割方法。
这种方法可以由以下几步实现:①设置整体图象阈值,将灰度图象转变成二值图象。②进行扫描,得到一个目标,并计算它凸外壳所占的面积。③计算凸标准A/H,其中,A为目标所占的面积,H为凸外壳所占的面积,并根据这个标准来判断目标的复杂程度:即当A/H≈1时,目标是凸的、孤立的;当A/H《1时,目标是复杂的,并由两个或多个目标交迭而成。④将复杂目标缩小K倍,直到所有接触的目标孤立为止。K值取决于A/H。⑤将每个孤立目标放大K倍。⑥将经放大的目标与原二值图象相加。⑦各目标孤立后,可进行面积、周长等的计算与计数。本方法的误差主要发生在图象边界,其原因是目标间的严重交迭。
, 百拇医药
随着图象处理技术的日益发展,区域分割的方法也不断改进。所有的区域分割方法都是与某种特定的研究目的相对应的,不可能找出一种统一的分割方法对所有的研究目的都具有最佳的分割效果。这从另一方面也说明了区域分割方法研究的必要性和复杂性。
6 参考文献
1 Poon SSS,et al.Cell recognition algorithms for the cell analyzer.IEEE/Ninth Annual Conference on the Engineering in Medicine and Biology Society 1997:1454-1456.
2 Reardon DM,et al.Automatic haematology:A comparative study of cell counting and sizing using aperture impedance and flow cytometric systems.Medical Laboratory Science 1997;44∶320-325.
, 百拇医药
3 John C.Russ,et al.Automatic discrimination of features in grey scale images.J Microscopy 1991;148(3)∶263-277.
4 Paul.J,McMilliam,et al.Minima equalization:A useful strategy in automatic processing of microscopic images.The Royal Microscopical Society 1994;127∶253-262.
5 Kenneth R.Diller,et al.Computer automated cell size and shape analysis in cryomicroscopy.The Royal Microscopical Society 1994;127∶209-219., 百拇医药