人类基因组计划与中国Hgp
http://www.100md.com
2001年10月4日
基因组测序:十年取得辉煌成绩
人类基因组计划(Human Genome Project,HGP)的目标旨在阐明人类基因组DNA长达3 X 109碱基对的序列,发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。美国于1990年正式启动HGP,原计划于2005年完成人类基因组全部序列的测定。欧共体、日本等发达国家和巴西、印度、中国等发展中大国也相继提出了各自的基因组研究计划。在过去的十年中,由于各国政府、科学界和工业界的共同努力,HGP作为全球性的合作项目已取得重大进展。
1998年,HGP由作图向大规模测序转换,测序步伐日益加快。就在这时成立了一家商业性基因组测序公司Celera,宣称用3年时间完成人类基因组序列测定,建立用于商业开发的数据库,并对一批最重要的人类基因进行专利申请。HGP因而出现了极为激烈的竞争局面。面对挑战,公共领域测序计划决定加快速度,计划于2000年春天获得工作草图。经美国、英国、日本、法国、德国和中国共16个测序中心或协作组的共同努力,完成工作草图的目标已经实现。到2000年4月15日止得到的完成序列达586Mb,占人类基因组18.2%。工作草图序列达2327.6Mb,覆盖了人类基因组的72.4%。两者相加已达到90%的预定目标。今年5月8日,宣布完成第一期,干5月9日进入第二期,预计2001年6月提前实现最终完成序列图。
, 百拇医药
与此同时,对整条染色体的精细测序也在紧锣密鼓地进行。1999年12月,发表了由英、日、美、加拿大、瑞典科学家共同完成的对人类22号染色体的常染色体部分共33.46 Mb的测序工作结果。该序列由12个连续序列群所组成,其中的缝隙均小于150 Kb。在这些序列中,共包括了545个基因和134个假基因。2000年5月,又发表了精确度更高的第21号染色体的全序列测定,这一工作由日、德为主的科学家组成的共同体完成。共测得长臂33.55 Mb的序列和短臂281 Kb的序列。测得序列中包括迄今最长的连续群,长达28.5Mb整条染色体序列中只有三处缝隙,总长只有100kb。在序列中包括了225个基因和59个假基因。
值得注意的是,在公共领域测序速度明显加快的同时,Celera于2000年4月6日宣布完成了一个人的基因组序列的测序阶段工作,估计代表了人类基因组的99%,现已开始序列组装,但未公布技术细节。该公司还宣布即将测定SNP和进行缝隙填补,其最终基因组数据库中将包含不同种族的6个个体的数据。因此,今后一段时间内公共领域与Celera之间的竞争还是十分激烈的。
, 百拇医药
HGP除了人类基因组的作图、测序之外,还包括对一批模式生物体的基因组研究。这些研究有助于在基因组水平上认识进化规律,以及利用模式生物的转基因和基因剔除术来研究基因的功能。对其他各种模式生物体,尤其是基因组很大的哺乳类动物和植物基因组的测序也将会不断展开。
功能基因组学:开创HGP新篇章
当前,随着结构基因组学向染色体完成序列图的目标顺利进展,以揭示基因组的功能及调控机制为目标的功能基因组学已提上议事日程。美国HGP1998-2003年的新目标除了完成基因组全序列测定之外,还有人类DNA序列变异等功能基因组学研究的内容。一般认为功能基因组研究的核心问题有:基因组的多样性;基因组的表达及其时空调节;模式生物基因组研究等。
(1)基因组多样性的研究
人类是一个具有多态性的群体。开展基因组多样性研究,无论对于了解人类的起源、进化和迁徒,还是对于生物医学均会产生重大的影响。已知人类基因组DNA序列中最常见的变异形式是SNP,在全基因组中估计有3-10 x l06个。Celera的人类基因组测序计划包括了SNP。针对此种情况,1999年国际上10家大药厂与三家研究机构建立了SNP协作组,进行SNP的随机筛选,计划到2001年获得30万个SNP。目前已有41200个SNP向公共领域公布。
, http://www.100md.com
在基因组多样性研究方面,一个近年备受医学界和制药工业界关注的新领域是药物基因组学。药物的疗效和副作用在不同个体间有差异,而这种差异很大程度上是不同个体间基因存在多态性,其基本形式也是SNP。药物基因组学就是要阐明个体间在药物代谢和效应方面发生差别的遗传基础,促使新药的发现,并根据个体的遗传背景来优化药物治疗方案,亦即“个体化治疗”。
(2)基因组的表达调控和蛋白质组学研究
一个细胞的转录表达水平能够精确而特异地反映其类型、发育阶段以及状态,是功能基因组学的主要研究内容之一。为了能够全面而不是孤立地评价全部基因的表达,需要建立全新的工具系统,其定量敏感度应达到1个拷贝/细胞。近年来发展的DNA芯片以及微量RNA探针制备技术已基本达到了这些目标。
蛋白质组学研究是在生命体或细胞的整体水平上研究蛋白质的表达和修饰状态。目前一般技术路线是提取细胞的蛋白质,利用标准化的双向凝胶电泳分离后,用质谱仪对各个蛋白点进行分析,根据多肽的特征分析并与蛋白质数据库进行比较,鉴别蛋白质的类型和检测其修饰状态。
, http://www.100md.com
(3)模式生物体乍为功能基因组学工具
如前所述,在人类基因组的研究中,模式生物体的研究占有极其重要的地位。模式生物体的基因组结构相对简单,但是它们的核心细胞过程和生化通路在很大程度上是保守的。通过比较和鉴别进化不同阶段生物体的基因组信息,将进一步加深对人类基因组结构和功能的了解。
识别基因功能最有效的方法可能是观察基因表达被阻断后在细胞和整体所产生的表型变化。在这方面,基因剔除模式生物成为特别有用的工具。近年来发展的条件化基因剔除术,已可达到对任何基因在不同发育阶段和不同器官、组织的选择性剔除。除了用同源重组技术制造基因剔除生物,也可用化学诱变剂或插入突变方法随机诱导模式生物体的基因突变,对产生表型变化者利用快速基因定位法识别致病基因。
HGP相关的若干伦理学问题
在整体上,HGP相关的伦理问题似可以归纳为两个方面:一是人类基因组基础数据的共享;二是基因组信息应用于医学保健方面所产生的问题。
, 百拇医药
人类基因组所包含的遗传信息是人类的共同遗产,理应为全人类所有。然而,遗传信息又蕴藏着极大的商业价值。因此,科学界与工业界之间,对于基因组序列知识产权问题就产生了较大的分歧。代表着国际人类基因组科学共同体主流的人类基因组组织(HUGO)在过去数年中就此发表过多次声明,认为人类基因组DNA的序列、功能和用途不明确的全长cDNA、以及EST和SNP等属于“竞争前”数据。对这些数据的独占或延误公布将阻碍科学的发展,故不应申请专利。而包括Celera公司等在内的一些私营机构却力图获得基因组基础数据的专利,或在相当长的时间内封锁有关数据。这种做法违背了大多数公众的利益,也将妨碍科学的进步,遭到科学界的反对。2000年3月14日,美国总统克林顿和英国首相布莱尔联合声明支持基因组数据公开的政策,使垄断基因组基础数据的企图明显受挫。值得指出,我国作为发展中国家,能否分享基因组基础数据对医学和生物制药产业发展至关重要。以笔者之见,既然我国已加入了国际公共领域的人类基因组测序计划,我国政府也应该在基因组数据公开这一重大原则问题上表态。
HGP也为推动医学进步带来了空前的机遇。疾病的基因诊断有可能发展成医学的重要分支和实现产业化。在婴几时期的基因筛查有可能识别出疾病基因或风险基因的携带者,这一被称为“预测医学”的做法,固然为疾病的早期预防提供了便利,但同时也可能带来一系列伦理、法律和社会学问题。诸如:病人的隐私权如何得到保护?他们的就业和保险是否会受到影响?是否会在社会上受到“遗传歧视”?近年来,整体动物克隆技术的发展使得生物技术的伦理问题更趋复杂化。因此,生物医学界和法律界应该就HGP的相关问题商讨制订对策,并取得全社会的理解和支持。
, http://www.100md.com
我国HGP的历史和现状
我国是一个人口大国,丰富的人群遗传资源是人类基因组研究的宝贵材料。我国的HGP计划于1994年启动,由国家自然科学基金委、国家高技术计划(863)和国家重点基础研究计划(973)所共同资助的。在过去的六年中,通过科学界的共同努力,组织了一支精干的科研队伍,建立厂全国性的遗传资源网,引进和建立了一整套较完整的基因组研究体系。同时,也获得了一批重要的研究成果。在基因组多样性领域,对中国人群的遗传关系以及与世界其他人群的关系进行了研究,研究结果支持现代智人“走出非洲”学说。另一方面,疾病基因的研究也取得了实质性的进展,克隆了遗传性高频耳聋的致病基因,定位了若干单基因疾病的染色体位点。在白血病和某些实体肿瘤相关基因的结构、功能研究方面,取得了一批具有国际影响的成果。此外在功能基因研究方面也实现了突破,已获得EST十多万条,克隆了1000条以上新基因的全长cDNA。上述工作成果,已有不少发表于国际著名学术刊物,得到了国际学术界的好评。
, http://www.100md.com 最近,我国HGP的研究规模和水平出现了质的飞跃。在国家科技部和上海市、北京市的大力支持下,相继成立了国家人类基因组南方和北方研究中心。在国家科技部和中国科学院的支持下,由中科院遣传所基因组中心、国家人类基因组南、北研究中心共同承担了全球人类基因组测序计划的l%(3号染色体短臂30 Mb区域)。经半年拼搏,取得了重大进展,工作草图已于今年4月底结束。除此以外,对若干致病微生物如钩端螺旋体的研究工作已在国家人类基因组研究中心展开。此外,一批实验室已致力于对中国人群SNP的大规模研究。试图揭示遗传和环境因子相互作用在我国人群疾病发生、发展中的作用。
对我国HGP的展望
最近,由于党和国家领导的高度重视,科学共同体和社会各界的广泛关注和大力支持,我国HGP终于作为国家计划而被确立。但是,必须清楚地看到,我国现有基因组研究队伍的总体状况和科学技术水平与国际先进水平仍存在着相当大的差距,因此要使我国真正从基因资源大国转为基因研究大国,还必须付出极大的努力。
, http://www.100md.com
为了从根本上改变我国基因组研究的分散状况,当前一个刻不容缓的任务是,国家科技部、教育部、卫生部、农业部、中国科学院和国家自然科学基金委员会等相关部门应打破部门界限,统一协调,迅速制订我国在今后5到10年内基因组研究的总体规划。根据有所为、有所不为的原则,突出重点,部署结构基因组学和功能基因组学的研究目标和内容。结构基因组学方面的一个重要问题是,我国现已承担的1%测序计划在达到工作草图阶段目标之后,如何继续向完成序列图努力?在诸多模式生物体基因组测序中,应该选择哪些目标,体现既促进我国生物技术和制药工业发展,同时又为国际人类基因组科学作出贡献的原则?
以笔者之见,对于我们这样一个人类遗传资源极为丰富的发展中国家,功能基因组学和医学(或疾病)基因组学应该放到十分重要的位置,成为今后我国基因组科学发展最重要的任务。建立各人群SNP的系统目录,将为阐明我国人群主要疾病的易感性,以及基于遣传学背景的个体化药物治疗和临床试验奠定基础。我国的模式生物研究己有一定基础,能否尽快达到规模化,将决定我国在基因功能分析方面的竞争力。
总之,在制定我国新一轮HGP计划时,应注意基因组科学与生物医学及其他学科和大的产业发展方向的衔接,避免孤军作战的局面。应该吸引数理化等学科的人才和工业界加入基因组科学的队伍。政府对于HGP应该有较长期、稳定的专项投入,并使这种投入纳入法制化的轨道。为了切实保证基因组基础数据为全人类所有,应进一步加强国际间的互利合作,使我国的人类基因组计划融人世界的人类基因组研究中。这样,我国的HGP就能获得持久的动力。(陈竺、黄薇、傅刚、韩泽广、任双喜), 百拇医药
人类基因组计划(Human Genome Project,HGP)的目标旨在阐明人类基因组DNA长达3 X 109碱基对的序列,发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。美国于1990年正式启动HGP,原计划于2005年完成人类基因组全部序列的测定。欧共体、日本等发达国家和巴西、印度、中国等发展中大国也相继提出了各自的基因组研究计划。在过去的十年中,由于各国政府、科学界和工业界的共同努力,HGP作为全球性的合作项目已取得重大进展。
1998年,HGP由作图向大规模测序转换,测序步伐日益加快。就在这时成立了一家商业性基因组测序公司Celera,宣称用3年时间完成人类基因组序列测定,建立用于商业开发的数据库,并对一批最重要的人类基因进行专利申请。HGP因而出现了极为激烈的竞争局面。面对挑战,公共领域测序计划决定加快速度,计划于2000年春天获得工作草图。经美国、英国、日本、法国、德国和中国共16个测序中心或协作组的共同努力,完成工作草图的目标已经实现。到2000年4月15日止得到的完成序列达586Mb,占人类基因组18.2%。工作草图序列达2327.6Mb,覆盖了人类基因组的72.4%。两者相加已达到90%的预定目标。今年5月8日,宣布完成第一期,干5月9日进入第二期,预计2001年6月提前实现最终完成序列图。
, 百拇医药
与此同时,对整条染色体的精细测序也在紧锣密鼓地进行。1999年12月,发表了由英、日、美、加拿大、瑞典科学家共同完成的对人类22号染色体的常染色体部分共33.46 Mb的测序工作结果。该序列由12个连续序列群所组成,其中的缝隙均小于150 Kb。在这些序列中,共包括了545个基因和134个假基因。2000年5月,又发表了精确度更高的第21号染色体的全序列测定,这一工作由日、德为主的科学家组成的共同体完成。共测得长臂33.55 Mb的序列和短臂281 Kb的序列。测得序列中包括迄今最长的连续群,长达28.5Mb整条染色体序列中只有三处缝隙,总长只有100kb。在序列中包括了225个基因和59个假基因。
值得注意的是,在公共领域测序速度明显加快的同时,Celera于2000年4月6日宣布完成了一个人的基因组序列的测序阶段工作,估计代表了人类基因组的99%,现已开始序列组装,但未公布技术细节。该公司还宣布即将测定SNP和进行缝隙填补,其最终基因组数据库中将包含不同种族的6个个体的数据。因此,今后一段时间内公共领域与Celera之间的竞争还是十分激烈的。
, 百拇医药
HGP除了人类基因组的作图、测序之外,还包括对一批模式生物体的基因组研究。这些研究有助于在基因组水平上认识进化规律,以及利用模式生物的转基因和基因剔除术来研究基因的功能。对其他各种模式生物体,尤其是基因组很大的哺乳类动物和植物基因组的测序也将会不断展开。
功能基因组学:开创HGP新篇章
当前,随着结构基因组学向染色体完成序列图的目标顺利进展,以揭示基因组的功能及调控机制为目标的功能基因组学已提上议事日程。美国HGP1998-2003年的新目标除了完成基因组全序列测定之外,还有人类DNA序列变异等功能基因组学研究的内容。一般认为功能基因组研究的核心问题有:基因组的多样性;基因组的表达及其时空调节;模式生物基因组研究等。
(1)基因组多样性的研究
人类是一个具有多态性的群体。开展基因组多样性研究,无论对于了解人类的起源、进化和迁徒,还是对于生物医学均会产生重大的影响。已知人类基因组DNA序列中最常见的变异形式是SNP,在全基因组中估计有3-10 x l06个。Celera的人类基因组测序计划包括了SNP。针对此种情况,1999年国际上10家大药厂与三家研究机构建立了SNP协作组,进行SNP的随机筛选,计划到2001年获得30万个SNP。目前已有41200个SNP向公共领域公布。
, http://www.100md.com
在基因组多样性研究方面,一个近年备受医学界和制药工业界关注的新领域是药物基因组学。药物的疗效和副作用在不同个体间有差异,而这种差异很大程度上是不同个体间基因存在多态性,其基本形式也是SNP。药物基因组学就是要阐明个体间在药物代谢和效应方面发生差别的遗传基础,促使新药的发现,并根据个体的遗传背景来优化药物治疗方案,亦即“个体化治疗”。
(2)基因组的表达调控和蛋白质组学研究
一个细胞的转录表达水平能够精确而特异地反映其类型、发育阶段以及状态,是功能基因组学的主要研究内容之一。为了能够全面而不是孤立地评价全部基因的表达,需要建立全新的工具系统,其定量敏感度应达到1个拷贝/细胞。近年来发展的DNA芯片以及微量RNA探针制备技术已基本达到了这些目标。
蛋白质组学研究是在生命体或细胞的整体水平上研究蛋白质的表达和修饰状态。目前一般技术路线是提取细胞的蛋白质,利用标准化的双向凝胶电泳分离后,用质谱仪对各个蛋白点进行分析,根据多肽的特征分析并与蛋白质数据库进行比较,鉴别蛋白质的类型和检测其修饰状态。
, http://www.100md.com
(3)模式生物体乍为功能基因组学工具
如前所述,在人类基因组的研究中,模式生物体的研究占有极其重要的地位。模式生物体的基因组结构相对简单,但是它们的核心细胞过程和生化通路在很大程度上是保守的。通过比较和鉴别进化不同阶段生物体的基因组信息,将进一步加深对人类基因组结构和功能的了解。
识别基因功能最有效的方法可能是观察基因表达被阻断后在细胞和整体所产生的表型变化。在这方面,基因剔除模式生物成为特别有用的工具。近年来发展的条件化基因剔除术,已可达到对任何基因在不同发育阶段和不同器官、组织的选择性剔除。除了用同源重组技术制造基因剔除生物,也可用化学诱变剂或插入突变方法随机诱导模式生物体的基因突变,对产生表型变化者利用快速基因定位法识别致病基因。
HGP相关的若干伦理学问题
在整体上,HGP相关的伦理问题似可以归纳为两个方面:一是人类基因组基础数据的共享;二是基因组信息应用于医学保健方面所产生的问题。
, 百拇医药
人类基因组所包含的遗传信息是人类的共同遗产,理应为全人类所有。然而,遗传信息又蕴藏着极大的商业价值。因此,科学界与工业界之间,对于基因组序列知识产权问题就产生了较大的分歧。代表着国际人类基因组科学共同体主流的人类基因组组织(HUGO)在过去数年中就此发表过多次声明,认为人类基因组DNA的序列、功能和用途不明确的全长cDNA、以及EST和SNP等属于“竞争前”数据。对这些数据的独占或延误公布将阻碍科学的发展,故不应申请专利。而包括Celera公司等在内的一些私营机构却力图获得基因组基础数据的专利,或在相当长的时间内封锁有关数据。这种做法违背了大多数公众的利益,也将妨碍科学的进步,遭到科学界的反对。2000年3月14日,美国总统克林顿和英国首相布莱尔联合声明支持基因组数据公开的政策,使垄断基因组基础数据的企图明显受挫。值得指出,我国作为发展中国家,能否分享基因组基础数据对医学和生物制药产业发展至关重要。以笔者之见,既然我国已加入了国际公共领域的人类基因组测序计划,我国政府也应该在基因组数据公开这一重大原则问题上表态。
HGP也为推动医学进步带来了空前的机遇。疾病的基因诊断有可能发展成医学的重要分支和实现产业化。在婴几时期的基因筛查有可能识别出疾病基因或风险基因的携带者,这一被称为“预测医学”的做法,固然为疾病的早期预防提供了便利,但同时也可能带来一系列伦理、法律和社会学问题。诸如:病人的隐私权如何得到保护?他们的就业和保险是否会受到影响?是否会在社会上受到“遗传歧视”?近年来,整体动物克隆技术的发展使得生物技术的伦理问题更趋复杂化。因此,生物医学界和法律界应该就HGP的相关问题商讨制订对策,并取得全社会的理解和支持。
, http://www.100md.com
我国HGP的历史和现状
我国是一个人口大国,丰富的人群遗传资源是人类基因组研究的宝贵材料。我国的HGP计划于1994年启动,由国家自然科学基金委、国家高技术计划(863)和国家重点基础研究计划(973)所共同资助的。在过去的六年中,通过科学界的共同努力,组织了一支精干的科研队伍,建立厂全国性的遗传资源网,引进和建立了一整套较完整的基因组研究体系。同时,也获得了一批重要的研究成果。在基因组多样性领域,对中国人群的遗传关系以及与世界其他人群的关系进行了研究,研究结果支持现代智人“走出非洲”学说。另一方面,疾病基因的研究也取得了实质性的进展,克隆了遗传性高频耳聋的致病基因,定位了若干单基因疾病的染色体位点。在白血病和某些实体肿瘤相关基因的结构、功能研究方面,取得了一批具有国际影响的成果。此外在功能基因研究方面也实现了突破,已获得EST十多万条,克隆了1000条以上新基因的全长cDNA。上述工作成果,已有不少发表于国际著名学术刊物,得到了国际学术界的好评。
, http://www.100md.com 最近,我国HGP的研究规模和水平出现了质的飞跃。在国家科技部和上海市、北京市的大力支持下,相继成立了国家人类基因组南方和北方研究中心。在国家科技部和中国科学院的支持下,由中科院遣传所基因组中心、国家人类基因组南、北研究中心共同承担了全球人类基因组测序计划的l%(3号染色体短臂30 Mb区域)。经半年拼搏,取得了重大进展,工作草图已于今年4月底结束。除此以外,对若干致病微生物如钩端螺旋体的研究工作已在国家人类基因组研究中心展开。此外,一批实验室已致力于对中国人群SNP的大规模研究。试图揭示遗传和环境因子相互作用在我国人群疾病发生、发展中的作用。
对我国HGP的展望
最近,由于党和国家领导的高度重视,科学共同体和社会各界的广泛关注和大力支持,我国HGP终于作为国家计划而被确立。但是,必须清楚地看到,我国现有基因组研究队伍的总体状况和科学技术水平与国际先进水平仍存在着相当大的差距,因此要使我国真正从基因资源大国转为基因研究大国,还必须付出极大的努力。
, http://www.100md.com
为了从根本上改变我国基因组研究的分散状况,当前一个刻不容缓的任务是,国家科技部、教育部、卫生部、农业部、中国科学院和国家自然科学基金委员会等相关部门应打破部门界限,统一协调,迅速制订我国在今后5到10年内基因组研究的总体规划。根据有所为、有所不为的原则,突出重点,部署结构基因组学和功能基因组学的研究目标和内容。结构基因组学方面的一个重要问题是,我国现已承担的1%测序计划在达到工作草图阶段目标之后,如何继续向完成序列图努力?在诸多模式生物体基因组测序中,应该选择哪些目标,体现既促进我国生物技术和制药工业发展,同时又为国际人类基因组科学作出贡献的原则?
以笔者之见,对于我们这样一个人类遗传资源极为丰富的发展中国家,功能基因组学和医学(或疾病)基因组学应该放到十分重要的位置,成为今后我国基因组科学发展最重要的任务。建立各人群SNP的系统目录,将为阐明我国人群主要疾病的易感性,以及基于遣传学背景的个体化药物治疗和临床试验奠定基础。我国的模式生物研究己有一定基础,能否尽快达到规模化,将决定我国在基因功能分析方面的竞争力。
总之,在制定我国新一轮HGP计划时,应注意基因组科学与生物医学及其他学科和大的产业发展方向的衔接,避免孤军作战的局面。应该吸引数理化等学科的人才和工业界加入基因组科学的队伍。政府对于HGP应该有较长期、稳定的专项投入,并使这种投入纳入法制化的轨道。为了切实保证基因组基础数据为全人类所有,应进一步加强国际间的互利合作,使我国的人类基因组计划融人世界的人类基因组研究中。这样,我国的HGP就能获得持久的动力。(陈竺、黄薇、傅刚、韩泽广、任双喜), 百拇医药