生物系统的复杂性与简单性
“复杂性”是当今科学界尤其是生命科学界最时髦的词汇之一。它的出现和流行,体现了21世纪科学家思考自然界的角度转换。上世纪是还原论占主导地位的时代,自然界被视为一部根据物理和化学规律用各种分子组装的自动机。因此,认识了分子层面上个别的基因或蛋白质的物理和化学特性,就能够解释生物个体的活动。随着研究的深入,人们已逐渐意识到了这种“简单性”思维的局限,意识到了生命的复杂性。目前,对复杂性的研究已成为生命科学的热点。在有关复杂性的众多研究问题中,也许最值得我们关注的是生物系统的复杂性与简单性之关系。
简单性:复杂生物系统的构造基础
近几年的有关研究工作表明,大多数复杂系统,不论是非生命的如电子线路或互联网,还是细胞的信号转导网络或代谢网络,都是根据等级制(hierarchy)的组织原则,通过各种简单的结构单元组装而成。最基本的结构单元通常是由若干个元件通过特定的相互作用形成的“基序”(motif);基序之间结合形成更大的结构单元,就是人们常常提到的具有一定结构和功能的“模块”(module);若干个不同的模块通过相互连接最终形成网络(详见《科学》2003年第3期第27页)。
, 百拇医药
“无尺度网络”(scale-free network)是复杂生物系统的最主要类型,其主要特点是网络可以无限地扩张,网络内各节点间连接数目按照指数规律分布,有的节点的连接数目很多,有的节点的连接数目则很少。例如,加拿大科学家采用免疫亲和沉淀方法和质谱技术,研究了大肠杆菌1 000个蛋白质之间的相互作用,发现它们服从无尺度网络的构成原则,网络中的大部分蛋白质彼此间仅形成少量的连接;但也有少数蛋白质能够出现很多的连接,如同车轮的中心,被形象地称为“辐射中心”(hub)[1]。人们通常认为,无尺度网络属于高度非均一性的复杂系统,也是根据等级制的方式构成。但是,最新的研究表明,这种类型的网络结构具有一种不变性,即自相似性(self-similarity)。研究者应用分形几何(fractal geometry)和统计物理方法,对互联网和蛋白质相互作用网络等各种真实的网络进行了特别的数学处理,揭示了一个前人没有发现的秘密,即无尺度网络像“俄罗斯套娃”一样具有保持原状的分支方式[2]。也就是说,这种网络不论有多大,都是由一个基本的拓扑结构单元逐级放大而形成的,或者说是由不同尺度的自我重复的模式组成的。这一发现告诉我们,自然界有可能采用另外一种简单的方式来构造复杂系统,即依据分形的原则,从一个“母体”通过对称变换而形成尺度不同的复杂生物网络。
, http://www.100md.com
复杂生物系统不论是采用等级制还是以自相似方式构成的,都体现了一个共同的特性:系统内的每一个元件都根据一定的规则组织起来。人脑是公认为最复杂的系统,有大约10亿个细胞。尽管人们早就知道大脑在宏观尺度上表现出高度的组织性,但在微观尺度的组织情况却不是很清楚。最近,科学家采用最新的单细胞钙成像技术,研究了哺乳动物的视觉皮层,首次在细胞水平上看到活体内单个脑细胞之间的联系,发现在猫视觉皮层的第18区的细胞之间,组成了特定的、边界清楚的结构[3]。这一研究表明,复杂生物系统的组织性远远超过我们的想象,而且其复杂性就是从最基本和最简单的结构单元开始,按照特定的规则一步步地形成最终的复杂系统。
复杂生物系统可以出现在生物界的各个层面上,包括分子水平、细胞水平、组织器官水平、个体水平和群体水平。众所周知,动物群体具有复杂的行为方式,例如候鸟的迁移和鱼群的洄游都是复杂的群体行为,似乎随机聚集在一起的许多个体在没有信号传递机制的条件下也能做出准确的、一致的决定。科学家最近采用数值模拟的方法,分析了动物群体在运动时做决定的过程和条件,发现在群体中只要有很一小部分掌握信息的个体就可以做出相当准确的决定;而且群体越大,那些掌握信息并可以用来指导群体的个体在群体中的比例就越低。 这个模型揭示出,动物群体中的个体可以在没有明确的信号分子或复杂的信息传递机制情况下,通过简单地感知邻近伙伴的行为来有效地传递信息并做出决定[4]。这项研究成果体现了复杂系统的精髓——让整个系统达到最优化,而不是考虑这个系统中的各个元件或个体的优化。
, http://www.100md.com
复杂性:简单生物系统的演化结果
复杂性严格说来是一个量的概念,通过比较的方式而得到。例如我们可以说真核生物比原核生物复杂,因为后者的细胞结构和分子组成比前者简单。然而,在大多数情况下,研究人员缺少测量生物系统复杂性的方法。不久前,科学家根据生物发育过程和计算机程序间的相似性,提出了一种度量生命复杂性的算法:一个细胞谱系(lineage)的复杂性,取决于它派生的亚细胞谱系所需要的最少的细胞分裂次数和方式[5]。研究者选择发育过程中细胞谱系可被精确认定的线虫(C. elegans)等4种后生动物,通过这一算法估算出这些物种的细胞谱系的复杂性在32%到38%之间。有趣的是,这些真实谱系要比用随机方法创造的谱系简单得多,表明后生动物的发育过程比人们想象的要简单,即进化选择倾向于降低细胞谱系的复杂性,因此细胞谱系简单得不能再简单了[5]。 也就是说,尽管单细胞发育形成的是相当复杂的多细胞个体,但是发育的基本单元——细胞谱系始终保持着其简单性。
, 百拇医药
基因和蛋白质构成的相互作用网络是生命最基本的复杂系统。加拿大科学家利用生物信息学的方法对125个物种的基因组进行比较,发现在这些属于无尺度的相互作用网络中,所有被认为是“辐射中心”的蛋白质都是在进化上高度保守的;而且这些蛋白质的连接能力与同源蛋白质在不同基因组出现的频率成正相关[1]。也就是说,蛋白质进化的速率可能受制于蛋白质的连接程度。此外,研究者进一步比较了在真核生物、细菌和古菌三大类群中都存在的相互作用的蛋白质对,发现每一对蛋白质都具有共同进化的趋势,意味着蛋白质的相互作用在进化上也同样是保守的。更重要的是,高度保守的蛋白质相互间有着高度的连接,形成一个紧密连接的核心网络。例如在大肠杆菌中,共有71个蛋白质形成了一个有着154个连接的核心网络;这些蛋白质在各种细菌中都很保守,并且很重要[1]。我们可以由此推论,在生命进化的早期,一些原初蛋白质形成了一个基本的相互作用网络;在随后的生命演化过程中,不断有新产生的蛋白质与这个核心网络发生相互作用,形成了越来越复杂的蛋白质活动网络,以满足生物体新的需求。
生物界复杂性的一般性特征是,组成成分(基因或蛋白质)的种类和数量随生物的复杂程度越高而明显增加。例如古菌的基因组通常有2 000个左右的基因,而细菌如大肠杆菌的基因组有4 000多个基因;单细胞真核生物如芽殖酵母基因组有6 000多个基因,而多细胞动植物则通常拥有数万个基因。不仅是基因数量,基因组中的非基因如转座子和重复序列的数量和种类,也会随物种复杂程度的增加而增加。因此,基因组复杂性的演化代表了生物体复杂性的演化。
, http://www.100md.com
人们也许要问,为什么生命的演化要采用这样的方式?由于种群是进化过程中自然选择的基本单位,科学家运用计算生物学的工具,分析了原核生物、单细胞真核生物、无脊椎动物和脊椎动物中不同物种的基因组复杂性与种群大小的关系,发现两者呈负相关,即物种的种群越小,则基因组越大并且越复杂。例如,拥有简单基因组的细菌的种群,个体数通常要超过1亿个;而具有复杂基因组的脊椎动物的种群,个体数范围则在1万到10万之间[6]。研究者推测,由于种群在长期进化过程中逐渐缩小并同时伴随着种群中个体体积的增加,从而引起了基因组复杂性和规模的被动增加[6] 。根据这一假设,真核生物基因组的大部分重构工作是通过非适应过程进行的。也就是说,真核生物基因组复杂性的增加并没有直接影响个体对环境的适应性。反之,这种重构的“中性”基因组却成为在自然选择下表型复杂性演化的“原材料”。
“复杂性”频频被提及,但有些时候这个术语只是被用做远离难题的“避难所”。一些研究者在遇到难以研究、难以理解的事物或现象时,常将其归之于“复杂性”,然后就心安理得地把问题束之高阁。笔者认为,一个真正的研究者应该正视和面对现实和生命中的复杂性,尽力去认识和研究;如爱因斯坦所倡导的,在木板最厚的部位而不是最薄的部位打洞。在这类研究中,从“简单性”入手是一个很不错的选择。
, 百拇医药
[1] Butland G, et al. Nature, 2005, 433: 531
[2] Song C, et al. Nature, 2005, 433: 392
[3] Ohki K, et al. Nature, 2005, 433: 597
[4] Couzin I D, et al. Nature, 2005, 433: 513
[5] Azevedo R B, et al. Nature, 2005, 433: 152
[6] Lynch M, Conery J S. Science, 2003, 302: 1401, 百拇医药(吴家睿)
简单性:复杂生物系统的构造基础
近几年的有关研究工作表明,大多数复杂系统,不论是非生命的如电子线路或互联网,还是细胞的信号转导网络或代谢网络,都是根据等级制(hierarchy)的组织原则,通过各种简单的结构单元组装而成。最基本的结构单元通常是由若干个元件通过特定的相互作用形成的“基序”(motif);基序之间结合形成更大的结构单元,就是人们常常提到的具有一定结构和功能的“模块”(module);若干个不同的模块通过相互连接最终形成网络(详见《科学》2003年第3期第27页)。
, 百拇医药
“无尺度网络”(scale-free network)是复杂生物系统的最主要类型,其主要特点是网络可以无限地扩张,网络内各节点间连接数目按照指数规律分布,有的节点的连接数目很多,有的节点的连接数目则很少。例如,加拿大科学家采用免疫亲和沉淀方法和质谱技术,研究了大肠杆菌1 000个蛋白质之间的相互作用,发现它们服从无尺度网络的构成原则,网络中的大部分蛋白质彼此间仅形成少量的连接;但也有少数蛋白质能够出现很多的连接,如同车轮的中心,被形象地称为“辐射中心”(hub)[1]。人们通常认为,无尺度网络属于高度非均一性的复杂系统,也是根据等级制的方式构成。但是,最新的研究表明,这种类型的网络结构具有一种不变性,即自相似性(self-similarity)。研究者应用分形几何(fractal geometry)和统计物理方法,对互联网和蛋白质相互作用网络等各种真实的网络进行了特别的数学处理,揭示了一个前人没有发现的秘密,即无尺度网络像“俄罗斯套娃”一样具有保持原状的分支方式[2]。也就是说,这种网络不论有多大,都是由一个基本的拓扑结构单元逐级放大而形成的,或者说是由不同尺度的自我重复的模式组成的。这一发现告诉我们,自然界有可能采用另外一种简单的方式来构造复杂系统,即依据分形的原则,从一个“母体”通过对称变换而形成尺度不同的复杂生物网络。
, http://www.100md.com
复杂生物系统不论是采用等级制还是以自相似方式构成的,都体现了一个共同的特性:系统内的每一个元件都根据一定的规则组织起来。人脑是公认为最复杂的系统,有大约10亿个细胞。尽管人们早就知道大脑在宏观尺度上表现出高度的组织性,但在微观尺度的组织情况却不是很清楚。最近,科学家采用最新的单细胞钙成像技术,研究了哺乳动物的视觉皮层,首次在细胞水平上看到活体内单个脑细胞之间的联系,发现在猫视觉皮层的第18区的细胞之间,组成了特定的、边界清楚的结构[3]。这一研究表明,复杂生物系统的组织性远远超过我们的想象,而且其复杂性就是从最基本和最简单的结构单元开始,按照特定的规则一步步地形成最终的复杂系统。
复杂生物系统可以出现在生物界的各个层面上,包括分子水平、细胞水平、组织器官水平、个体水平和群体水平。众所周知,动物群体具有复杂的行为方式,例如候鸟的迁移和鱼群的洄游都是复杂的群体行为,似乎随机聚集在一起的许多个体在没有信号传递机制的条件下也能做出准确的、一致的决定。科学家最近采用数值模拟的方法,分析了动物群体在运动时做决定的过程和条件,发现在群体中只要有很一小部分掌握信息的个体就可以做出相当准确的决定;而且群体越大,那些掌握信息并可以用来指导群体的个体在群体中的比例就越低。 这个模型揭示出,动物群体中的个体可以在没有明确的信号分子或复杂的信息传递机制情况下,通过简单地感知邻近伙伴的行为来有效地传递信息并做出决定[4]。这项研究成果体现了复杂系统的精髓——让整个系统达到最优化,而不是考虑这个系统中的各个元件或个体的优化。
, http://www.100md.com
复杂性:简单生物系统的演化结果
复杂性严格说来是一个量的概念,通过比较的方式而得到。例如我们可以说真核生物比原核生物复杂,因为后者的细胞结构和分子组成比前者简单。然而,在大多数情况下,研究人员缺少测量生物系统复杂性的方法。不久前,科学家根据生物发育过程和计算机程序间的相似性,提出了一种度量生命复杂性的算法:一个细胞谱系(lineage)的复杂性,取决于它派生的亚细胞谱系所需要的最少的细胞分裂次数和方式[5]。研究者选择发育过程中细胞谱系可被精确认定的线虫(C. elegans)等4种后生动物,通过这一算法估算出这些物种的细胞谱系的复杂性在32%到38%之间。有趣的是,这些真实谱系要比用随机方法创造的谱系简单得多,表明后生动物的发育过程比人们想象的要简单,即进化选择倾向于降低细胞谱系的复杂性,因此细胞谱系简单得不能再简单了[5]。 也就是说,尽管单细胞发育形成的是相当复杂的多细胞个体,但是发育的基本单元——细胞谱系始终保持着其简单性。
, 百拇医药
基因和蛋白质构成的相互作用网络是生命最基本的复杂系统。加拿大科学家利用生物信息学的方法对125个物种的基因组进行比较,发现在这些属于无尺度的相互作用网络中,所有被认为是“辐射中心”的蛋白质都是在进化上高度保守的;而且这些蛋白质的连接能力与同源蛋白质在不同基因组出现的频率成正相关[1]。也就是说,蛋白质进化的速率可能受制于蛋白质的连接程度。此外,研究者进一步比较了在真核生物、细菌和古菌三大类群中都存在的相互作用的蛋白质对,发现每一对蛋白质都具有共同进化的趋势,意味着蛋白质的相互作用在进化上也同样是保守的。更重要的是,高度保守的蛋白质相互间有着高度的连接,形成一个紧密连接的核心网络。例如在大肠杆菌中,共有71个蛋白质形成了一个有着154个连接的核心网络;这些蛋白质在各种细菌中都很保守,并且很重要[1]。我们可以由此推论,在生命进化的早期,一些原初蛋白质形成了一个基本的相互作用网络;在随后的生命演化过程中,不断有新产生的蛋白质与这个核心网络发生相互作用,形成了越来越复杂的蛋白质活动网络,以满足生物体新的需求。
生物界复杂性的一般性特征是,组成成分(基因或蛋白质)的种类和数量随生物的复杂程度越高而明显增加。例如古菌的基因组通常有2 000个左右的基因,而细菌如大肠杆菌的基因组有4 000多个基因;单细胞真核生物如芽殖酵母基因组有6 000多个基因,而多细胞动植物则通常拥有数万个基因。不仅是基因数量,基因组中的非基因如转座子和重复序列的数量和种类,也会随物种复杂程度的增加而增加。因此,基因组复杂性的演化代表了生物体复杂性的演化。
, http://www.100md.com
人们也许要问,为什么生命的演化要采用这样的方式?由于种群是进化过程中自然选择的基本单位,科学家运用计算生物学的工具,分析了原核生物、单细胞真核生物、无脊椎动物和脊椎动物中不同物种的基因组复杂性与种群大小的关系,发现两者呈负相关,即物种的种群越小,则基因组越大并且越复杂。例如,拥有简单基因组的细菌的种群,个体数通常要超过1亿个;而具有复杂基因组的脊椎动物的种群,个体数范围则在1万到10万之间[6]。研究者推测,由于种群在长期进化过程中逐渐缩小并同时伴随着种群中个体体积的增加,从而引起了基因组复杂性和规模的被动增加[6] 。根据这一假设,真核生物基因组的大部分重构工作是通过非适应过程进行的。也就是说,真核生物基因组复杂性的增加并没有直接影响个体对环境的适应性。反之,这种重构的“中性”基因组却成为在自然选择下表型复杂性演化的“原材料”。
“复杂性”频频被提及,但有些时候这个术语只是被用做远离难题的“避难所”。一些研究者在遇到难以研究、难以理解的事物或现象时,常将其归之于“复杂性”,然后就心安理得地把问题束之高阁。笔者认为,一个真正的研究者应该正视和面对现实和生命中的复杂性,尽力去认识和研究;如爱因斯坦所倡导的,在木板最厚的部位而不是最薄的部位打洞。在这类研究中,从“简单性”入手是一个很不错的选择。
, 百拇医药
[1] Butland G, et al. Nature, 2005, 433: 531
[2] Song C, et al. Nature, 2005, 433: 392
[3] Ohki K, et al. Nature, 2005, 433: 597
[4] Couzin I D, et al. Nature, 2005, 433: 513
[5] Azevedo R B, et al. Nature, 2005, 433: 152
[6] Lynch M, Conery J S. Science, 2003, 302: 1401, 百拇医药(吴家睿)