识别基因的新技术
尽管被完全测序的基因组数量已越来越多,但研究人员仍需要为最后确定究竟有多少基因隐藏在这些遗传序列“丛林”中而大费脑筋。现在,Michael Snyder和他的同事发明了一套完整方案来解决这个问题,应用这个方法,可以轻松而大规模地对拥有庞大基因组的生物体进行筛查。通过这种方法,他们已经检测出100多个以前未被识别的酵母基因。有关研究结果发表在2002年1月期的《自然生物技术》(Nature Biotechnology)上。
为达到目的,研究人员使用了一个多步骤的方法。首先,通过附加一个编码β-半乳糖苷酶(β-galactosidase)的外源DNA序列(即Tn3转座子标签)检测出那些有“活性”并因而有可能编码蛋白质的基因序列。β-半乳糖苷酶可通过染色检测到。染色使得含有DNA标签的酵母菌落可以被识别出来;从而就可以测序们的DNA,任何与已知基因不符的序列都可被选为潜在的新基因。
第二步为:(1)核实“新”序列确实是编码基因,(2)确定新序列在DNA双链(指有义链、编码链和反义链)上的位置,用标记基因的RNA在DNA寡核苷酸芯片中进行筛选。还可以用新序列对来自其它生物体基因组中的序列数据库进行筛选以便寻找能够为序列功能提供线索的信息。
通过这个方案,研究人员识别出137个新基因。其中约有75%比早先认为的有效基因最小长度(约300个碱基)还要短,这意味着根据以前用于识别DNA序列中的基因的标准,这些新基因都不应算作基因。出乎意料的是,有15个新基因位于其它已知基因之内,但却是在这些已知基因的反义链上。
研究人员认为这种方法弥补了其它基因检测技术的不足,使得基因“猎人”们可以识别出难以察觉的基因。自1997年酵母基因组图谱公布以来,4年中功能基因组学和比较基因组学研究仅识别出65个另外的基因。而仅此一篇文章中,Snyder和他的同事所识别出的新基因数就是这个数字的2倍——其中约有2%早先已知存在于酵母基因组中。, http://www.100md.com
为达到目的,研究人员使用了一个多步骤的方法。首先,通过附加一个编码β-半乳糖苷酶(β-galactosidase)的外源DNA序列(即Tn3转座子标签)检测出那些有“活性”并因而有可能编码蛋白质的基因序列。β-半乳糖苷酶可通过染色检测到。染色使得含有DNA标签的酵母菌落可以被识别出来;从而就可以测序们的DNA,任何与已知基因不符的序列都可被选为潜在的新基因。
第二步为:(1)核实“新”序列确实是编码基因,(2)确定新序列在DNA双链(指有义链、编码链和反义链)上的位置,用标记基因的RNA在DNA寡核苷酸芯片中进行筛选。还可以用新序列对来自其它生物体基因组中的序列数据库进行筛选以便寻找能够为序列功能提供线索的信息。
通过这个方案,研究人员识别出137个新基因。其中约有75%比早先认为的有效基因最小长度(约300个碱基)还要短,这意味着根据以前用于识别DNA序列中的基因的标准,这些新基因都不应算作基因。出乎意料的是,有15个新基因位于其它已知基因之内,但却是在这些已知基因的反义链上。
研究人员认为这种方法弥补了其它基因检测技术的不足,使得基因“猎人”们可以识别出难以察觉的基因。自1997年酵母基因组图谱公布以来,4年中功能基因组学和比较基因组学研究仅识别出65个另外的基因。而仅此一篇文章中,Snyder和他的同事所识别出的新基因数就是这个数字的2倍——其中约有2%早先已知存在于酵母基因组中。, http://www.100md.com