当前位置: 首页 > 药学版 > 生命科学 > 专家综述
编号:10506201
探基因组之迷 寻合成生命之梦
http://www.100md.com 科学杂志
     最小基因组与生命起源

    生命最本质的特征是,每一个生物体都拥有一份控制其结构和功能的“设计图”,这份“设计图”还可以一代代地遗传下去。在孟德尔和摩尔根时代,这份“设计图”被称为“遗传因子”或者“基因”,而在后基因组时代则被称为“基因组”。如果说达尔文的进化论关心的是物种起源,那么今天的进化论研究者则是把视野聚集在基因组的起源。此外,寻找最早基因组的工作又引出了另外一个非常重要的问题:维持一个能够独立生存的生物个体的基因组应该有多大。换句话说,能否得到一个满足生命活动最低需求的最小基因组。

    最初的祖先

    根据当代生物进化论研究者的观点,地球上的所有生命都可以归结到三个生物类群的某一类中。这三个类群分别是真核生物类(eukaryotes)、真细菌类(eubacterial)和古细菌类(archaea)。我们所熟知的动植物属于真核生物类,而大肠杆菌等原核生物大多属于真细菌类。古细菌则是一类不同于真细菌类的古核生物,它们通常生长在一些极端条件下,如生长在100℃以上环境中的嗜热细菌,或高盐浓度下的嗜盐细菌。通过分子层面的深入分析,人们发现,与真细菌相比,古细菌的一系列分子生物学特征与真核生物接近,表明真核生物的祖先可能源于古细菌类。也就是说,从系统发育关系来看,古核生物介于原核生物和真核生物之间。因此可以进一步推论,原核生物和古核生物有可能是从一种更为原始的细胞演化而来,这种原始细胞也许就是生命最初的祖先。
, 百拇医药
    生命进化的基石建立在遗传物质的变异和遗传上,因此研究基因组自然成了人们理解进化的一把钥匙。迄今为止,已有上百个物种的基因组进行了全序列分析,比较不同物种的基因组有助于揭示物种间的亲缘关系和演变进程。人们期望通过对基因组的研究,找到所有生命的共同祖先。这种祖先被命名为“第一个基本的共同祖先”(last universal common ancestor, LUCA)。

    在寻找LUCA的过程中,研究古细菌的基因组非常重要,因为古细菌的生长环境更接近原始地球的状态。在1996年,科学家们解析了从深海发现的古细菌物种詹氏甲烷球菌(Methanococcus jannaschii)的基因组全序列。这是第一个被分析的古细菌类生物的基因组,其主要的环状染色体共有150万对碱基,含大约1700个基因[1] 。通过比较基因组研究,研究者推断出“第一个基本的共同祖先”可能具备这样一些特征:蛋白质合成的装置最为发达,但尚未完全;RNA合成的功能要比蛋白质合成差一些;而DNA合成的机制则基本没有。此外,它具有较为发达的代谢途径,包括氨基酸和核苷酸代谢,以及辅酶的合成等。
, 百拇医药
    基因平行转移

    尽管1990年代人们在寻找“第一个基本的共同祖先”方面取得了一些进展,但是还有许多基本的问题尚未回答。有些问题实际上对这种原初祖先的存在从根本上进行了挑战。其中最大的一个问题是,对三种类群生物的基因组进行比较的结果发现,只有大约60个左右的基因是普遍存在的,可以认为是属于“第一个基本的共同祖先”。显然,这些基因远不足以维持一个哪怕是像“第一个基本的共同祖先”一样最简单的有机体的生存。此外,对rRNA基因和氨酰-tRNA合成酶的种系发生的分析表明,这些基因和蛋白质并不存在一个稳定的系统发育关系;所谓最原始的特征,完全取决于研究者所研究的基因是什么。换句话说,种系分析揭示的仅仅是什么基因是原始的,而胝庑┗颉奥浠А钡奈镏置挥泄叵怠S纱丝蒲Ъ颐且馐兜剑蚩赡茉诓煌奈镏旨浣凶啤?

    基因平行转移(horizontal gene transfer, HGT),是比较基因组全序列得到的一个令人震惊的结果。例如,在人类基因组中,有200多个基因是从细菌基因组中转移而来的,而在其他真核生物物种的基因组中没有发现这些基因。基因平行转移显然与经典的达尔文进化论相冲突,因为经典的进化论认为,在生命的进化树系统中,遗传物质只能是一代代垂直地进行传递。根据基因平行转移的特点,美国科学家伍斯(C. Woese)在1998年提供了一个全新的理论来解释“第一个基本的共同祖先”,即这种原初的祖先并不是一个具有特定基因组的个体,而是一个许多彼此分享基因的个体组成的群体。也就是说,“第一个基本的共同祖先”并不是一个特定的完整的个体,而是一个有着各式各样遗传背景的原始细胞群体,它们作为一个完整的生命单元一起生存和演化[2]。在这种群体中,没有垂直性的遗传,主要依靠的是基因平行转移的方式。渥斯认为,在这个最早期的生命王国里,人们看到的是,“在细胞的海洋里到处浮动着基因和其产物”。
, 百拇医药
    不久前,渥斯在他的关于“第一个基本的共同祖先”是一个群体的理论基础上,提出了早期细胞进化的模型[3]。最初的原始细胞的构成非常简单并非常松散,其细胞的所有组成成分很容易通过基因平行转移的方式进行改变或取代,从而基因平行转移方式成为早期细胞进化的主要动力。这种原始细胞的进化的基本单位是群体,以一个生态系统(ecosystem)作为一个整体进行演化。当这些原始细胞的构成变得相当复杂和相互关联后,原始细胞的演化进入了一个临界点;在这个临界点上,细胞的各成分出现了高度的整合,新性状可以通过垂直的方式形成和传递。伍斯称这个临界点为“达尔文式阈值”(Darwinian threshold),因为原始细胞一旦过了这个关口,就开始形成了位于达尔文系统进化树“根部”的真正的细胞。

    最小基因组

    尽管“第一个基本的共同祖先”通过在细胞群体间采用基因平行转移的方式分享基因和其产物而回避了“最小基因组”的难题,但研究者依然想知道“最小基因组”的大小和基本组成。生殖道支原体(Mycoplasma genitalium)是一种寄生细菌,它的基因组是目前已测定的物种基因组中最小的一个,仅有468个基因。科学家将它的基因组与另外一种细菌流感嗜血杆菌(Haemophilus influenzae)的基因组序列进行了详细的比较,发现有240个生殖道支原体基因与流感嗜血杆菌基因存在垂直同源性(orthologs),因此认为最小基因组需要大约250个基因[4]。
, 百拇医药
    这里要注意,离开环境单独讨论最小基因组毫无意义,必须要把生物生存的外部环境作为基本的边界条件。一般认为,最小基因组的生物个体应该生存在具有所有基本的营养成分和没有环境压力的条件下。在这种环境下的最小基因组的主要组成部分如下:(1)一个几乎完整的翻译系统;(2)一个基本上完整的DNA复制机器;(3)一个进行DNA重组和修复的系统;(4)具有4个RNA聚合酶亚单位的转录装置;(5)一组参与蛋白质折叠的分子伴侣蛋白;(6)完整的无氧中间代谢途径;(7)辅酶合成途径;(8)蛋白质转运机器[4]。

    最小基因组的确定除了通过用计算手段比较基因组以外,另一个重要的途径是采用实验的手段。早在比较基因组方法出现之前,美国科学家伊塔亚(M. Itaya)就利用基因剔除方法,在细菌枯草芽孢杆菌(Bacillus subtilis)基因组上随机敲除了79个基因,通过分析这些基因剔除品系是否存活来探讨最小基因组。他的结果与后来利用计算和比较基因组方法得到的非常接近[5]。另一位著名的科学家文特(C. Venter)也采用基因剔除的办法,对上面所说的生殖道支原体的基因逐个进行敲除,并检查其存活情况。文特研究组利用实验的手段表明,生殖道支原体有可能只需要265到350个基因就可以生存[6]。这个结果与比较基因组方法得到的也非常接近。
, 百拇医药
    但是,采用逐一敲除的方式来确定最小基因组有着一个很大的缺陷。例如有一组基因,敲除其中的某一个时并不影响个体的生存,似乎这些基因并不是必需的;但如果把一组基因全部敲除后,个体将死亡。目前生物学家只能做到同时敲除两个基因。显然,若考虑在300个基因这样一个数目上基因的排列与组合,采用基因敲除的方法来寻找必需基因是很难做到的。因此,文特提出了一个截然不同的实验方法:人工合成基因组,即通过人工设计和合成基因的方法来构造最小基因组(详见下文“合成生命之梦”)。

    对于几十亿年前的生命,人们通常用化石来证明它们的存在。而对于建立在基因平行转移机制上的“第一个基本的共同祖先(群体)”,从逻辑上讲则不可能得到直接的证据。然而,这一理论有助于我们理解“基因平行转移”在生命进化中扮演的角色,同时它使我们在理解最小基因组时有一种新的思路。最小基因组的确定则不仅有助于研究生命的起源,而且有助于人工合成全新的生命。后者对今天的生命科学工作者意义更为重大。

    [1] Bult C J, et al. Science, 1996, 273: 1058
, 百拇医药
    [2] Woese C. Proc. Natl Acad Sci USA, 1998, 95: 6854

    [3] Woese C. Proc. Natl Acad Sci USA, 2002, 99: 874

    [4] Mushegian A R, Koonin E V. Proc Natl Acad Sci USA,1996, 93: 10268

    [5] Itaya M. FEBS Letter, 1995, 362: 257

    [6] Clyde A, et al. Science, 1999, 286: 2165

    合成生命之梦

    对于极端的活力论者来说,不仅生命与非生命有着不可逾越的界线,而且构造生命的物质与组成非生命的物质之间也有着本质的区别。在1828年,德国化学家维勒(F. W?觟hler)人工合成了存在于生物体的一种有机物——尿素,第一次打破了“生”与“死”的物质壁垒。从此,人工合成生命成了生命科学工作者的一个梦想。在1960年代,中国科学家通力合作,采用化学方法首次成功地合成了具有生物活性的蛋白质——胰岛素,在人工合成生命的征途上跨出了一大步。随着后基因组时代的到来,科学家又奏响了合成生命的新乐章。
, 百拇医药
    合成基因组

    基因组是生命最基本的信息载体,在由成千上万的碱基构成的核酸链上,记载了生命活动需要的所有遗传信息。显然,人工合成基因组是合成生命的一个重要目标。尽管当今先进的核苷酸自动合成仪已经能够合成长达上千个碱基的大片段,但是,要合成一个没有任何错误的基因组,哪怕是像病毒那样仅有数千个碱基的小小的基因组,对研究者也是一个巨大的挑战。

    2002年9月,美国《科学》周刊登载了纽约州立大学石溪分校魏玛(E.Wimmer)小组的工作。他们用了3年的时间合成出了脊髓灰质炎病毒(poliovirus)的全基因组序列,共7500个碱基。经过实验证明,这些人工合成的病毒基因组不仅可以指导合成出与天然病毒蛋白质同样的蛋白质,而且它们同样具有侵染宿主细胞的活力[1]。

    不久前,美国的科学家又一次传出了消息,一种称为φX174噬菌体的病毒的基因组也实现了人工全合成[2]。这一工作出自文特博士(J. C. Venter)领导的生物能转化研究所。凡是了解基因组测序的人都知道文特这个名字。正是他一个人带领一家公司,与国际人类基因组组织竞争,独自用“鸟枪法”测定了人类基因组框架图。完成了基因组测序后,文特博士又找到了一个更具挑战的课题——人工合成微生物,计划用这类人造微生物去解决世界的能源问题和环境问题。作为这个宏伟目标的第一步,文特决定首先解决合成最小基因组——病毒基因组的技术问题。文特等人大大改进了合成和拼接序列的技术,他们的基因组合成技术不仅可以在两个星期内合成一个5000个碱基以上的病毒基因组,而且有可能采用这一技术拼接出含3万个碱基或更大的基因组。为这个项目提供资助的美国能源部认为,文特博士的这一工作如同早期的测序工作一样,初看起来没什么大用,但从长远的发展来看,却可能有着巨大的潜力。而从基础研究方面看,合成生命的这个在基因组层面的进展意义则更为深远。
, 百拇医药
    扩增遗传密码

    在人工合成基因组时,最关键的任务是要保持合成的所有碱基序列与天然的序列完全一致,因为一个碱基的失误就有可能导致基因的突变,从而引起蛋白质功能的丧失。而这一切的根源要追朔到遗传密码。基因作为遗传的核心内容,被确定为一段具有特定碱基序列的DNA片段。在这段序列上的每3个相连的特定碱基决定一种氨基酸,这样的三碱基组合被称为遗传密码。也就是说,基因是由若干个遗传密码按特定的方式构成的,这些遗传密码决定了相应的蛋白质上氨基酸的种类和排列顺序。

    在自然界中绝大多数情况下,组成蛋白质的天然氨基酸只有20种,而4种碱基的三联体排列组合却可以得到64种(43)密码子。大量的实验室工作表明,生物体所具有的64种密码子中,有61种被用来编码20种天然氨基酸,剩余的3种则作为终止密码(非氨基酸密码)。这一编码规则在几乎所有的生物体包括动物、植物、微生物中都得到遵守。我们或许要向自然界追问,为什么只选择了20种氨基酸进行编码?
, 百拇医药
    尽管遗传密码最初的起源尚无定论,但改造遗传密码的工作却已经开始。美国加州大学伯克利分校的舒尔兹(P. G. Schultz)实验室不久前证明,通过人工的方法可以增加用来编码非天然氨基酸的新遗传密码[3]。他们首先把大肠杆菌基因组中的无义密码“UAG”确定为新的遗传密码候选者,然后通过遗传工程的方法诱导天然的转运核糖核酸(tRNA)突变并进行筛选,从中找到可以结合特定的某种非天然氨基酸,并且有相应反密码子“CUA”的独特的tRNA。在此基础上进而从氨酰-tRNA合成酶突变库中,筛选出可专一结合这种特殊tRNA的独特的合成酶。通过这三步过程,研究者成功地将一种非天然的修饰氨基酸,按照预定的指令(密码)编入了蛋白质的序列之中,使大肠杆菌的遗传密码第一次得到了人为的扩增[3]。

    舒尔兹研究室在随后的工作中表明,这种增加遗传密码的新策略,可以用来在天然蛋白质的组成中添加各种各样的非天然氨基酸。目前他们已将13种具有新功能的天然氨基酸,通过增加新遗传密码的方式合成到蛋白质中去。人工增加遗传密码的方式不仅具有理论意义,而且更重要的是具有很强的应用价值。例如,可以把用荧光素或生物素标记的氨基酸整合进蛋白质以利于检测;或者将重原子标记的氨基酸整合进蛋白质,从而直接用于蛋白质晶体结构的分析。
, http://www.100md.com
    建造细胞的控制网络

    生命作为一个复杂系统,其行为受控于由许许多多不同的基因或者蛋白者相互作用形成的网络。在一个细胞内,存在有基因调控网络、信号转导网络和代谢网络等。随着系统生物学的发展,人们已经逐渐地认识到生命复杂系统构成的基本规律。而根据这些基本原理,科学家又可以人为地设计并建造非天然的控制生命活动的分子网络。近些年来,一门新的学科——“合成生物学”(synthetic biology)正在形成。它类似于过去的遗传工程,根据生物系统设计的最基本规则,人工建造一些基本的生物部件(模块),然后用这些部件组装成生命复杂网络。

    目前在建造生物网络的工作中,大多数研究者都集中在如何设计基因线路图(gene circuit 或 genetic circuit)方面。就如同工程师通常设计电路图一样,合成生物学家设计出了振荡器(oscillator)和反馈回路(feedback loop)等各种基本单元。例如美国普林斯顿大学的研究者在大肠杆菌中,导入了一个由三个抑制基因构成的元件。在这三个基因中,A基因抑制B基因表达,B基因将C基因关闭,C基因则将A基因关闭;此外,C基因可以诱导一个绿色荧光蛋白基因的表达。这样一个装置显然是一个有限回路的振荡器,通过外界环境对其中某一个基因的干扰,控制细胞内绿色荧光蛋白的合成,从而可以使大肠杆菌像灯塔一样闪烁[4]。
, 百拇医药
    虽然研究者尽力去分析生命复杂系统,但是他们哪怕面对的是一个最简单的生物系统,仍然难以了解系统内的每一个参数,或预测系统的动力学精确特性。也就是说,人工设计是基于知识的不完备性。此外,当根据基本原理进行设计的人工网络置入到细胞内时,由于其功能的行使高度依赖于细胞内环境,因此人工网络在活细胞内的表现,很有可能不同于设计的预期,可能表现很差,甚至不起作用。不久前,美国的科学家巧妙地把基于理论的设计和人工定向进化方法(directed evolution)结合起来,将设计好的人工基因调控回路通过在细胞内选择的方式进行“自我完善”,从而使最初不理想的甚至不发挥作用的回路演化成为有功能的回路[5]。在这一工作中,研究者首先将两个带有不同基因和筛选标记的质粒,按照三个节点的逻辑控制门(IMPLIES logic gate)的功能要求进行设计和构造,并导入大肠杆菌。随后通过随机突变和选择的定向进化方法,得到了优于原设计功能的突变型质粒[5]。

    赋予生命以新语言

    当前的人工基因线路图的设计与制造,大多是在单细胞水平上进行。但是,对于自然界的生命而言,多细胞系统的控制更为重要。作为单细胞个体的微生物,其活动总是发生在成千上万个个体聚集而成的群体之间;而作为多细胞生物的动植物,其细胞间的通讯必然是整个个体活动的必要条件。因此,要想真正地实现人工生命合成,更大的挑战是如何设计用于细胞间通讯的“人工语言”。
, 百拇医药
    从理论上讲,要想用工程的方法解决细胞与细胞之间的通讯,必须建造可以按预先设计的程序发出讯号的发送者,以及能接收讯号并做出响应的接受者。对于发送者,至少需要三种能力:合成用作讯号的化学物质并能将其分泌或扩散出去、调节讯号发生的控制器。对于接受者而言,需要有接收讯号的受体、信号转导途径,以及直接对讯号做出响应的反应器,或能与反应器相互作用的机制。

    不久前,美国普林斯顿大学的研究者报道了他们的一项最新成果:通过整合基因和代谢网络的功能,设计成功了细胞与细胞间的非天然通讯。研究者首先构建了利用氨基酸合成反应生成乙酯的基因调控回路,使这一代谢过程中形成的乙酯成为细胞间通讯的信号分子。此外,再构建一个利用乙酯调控氮代谢的基因表达系统作为接受者。由此人工建造了一种被称为“quorum sensing”(QS)的通讯方式。通过QS方式,细菌释放出自我诱导分子,并且当这类分子达到阈值浓度时(即细胞生长到一定的密度时),可以激活相关的代谢调控基因[6]。

    从上述种种工作中可以看到,合成生物学家们已经取得了不小的进展。人们正在期待着,也许在不远的将来,研究者可以合成一个人工细胞。在2003年6月,美国劳伦斯-伯克利国家实验室成立了世界上第一个合成生物学研究部。一个欧洲范围的支持合成生物学的研究项目也已经启动。2004年6月,首届合成生物学大会将在美国麻省理工学院召开。合成生物学正在向我们走来。合成生物学有可能为世界能源危机和环境污染等,提供新的解决方案和新技术。当然,合成生物学是否会带来新的生物恐怖问题和对生命伦理的挑战,也应该加以足够的重视。不论好坏与否,合成生物学作为后基因组时代的一门新兴学科,已经表现出了巨大的生命力和广阔的运用前景。
, 百拇医药
    [1] Cello J, Paul A V, Wimmer E. Science, 2002, 297: 1016

    [2] Smith H O, Hutchison C A, Pfannkoch C, Venter J C. Proc Natl. Acad Sci USA, 2003, 100: 15440

    [3] Wang L, Brock A, Herberich B, Schultz P C. Science, 2001, 292: 498

    [4] Elowitz M B. Leibler S. Nature, 2000, 403: 335

    [5] Yokobayashi Y, Weiss R, Arnold F H. Proc Natl Acad Sci USA, 2003, 99: 16587

    [6] Bulter T, Lee S, Wong W W, et al. Proc Natl Acad Sci USA, 2004, 101: 2299

    注:本文为吴家睿研究员在《科学》2004年第3期和第5期上的两篇文章, http://www.100md.com(吴家睿 )