当前位置: 首页 > 期刊 > 《中国中药杂志》 > 2014年第9期
编号:13129872
中药高通量转录组研究进展(1)

     [摘要]中药是中华传统文化的瑰宝,是中华民族智慧的结晶。新方法技术的不断应用使得中药研究与时俱进。高通量转录组研究经过数年的发展,已经成为一项较为成熟的研究手段。该文对中药转录组研究概况进行了综述,比较了Roche公司的GS FLXTM平台和Illumina公司的HiSeqTM 2000平台两大测序平台,介绍了中药转录组分析的流程,并以西洋参和金银花为例,阐述了中药转录组研究的特色。对传统中药进行高通量转录组研究,可以从整体水平上了解目标物种的功能基因概况,明确活性成分的代谢通路,为中药研究奠定分子生物学基础,为传统中医药理论提供现代生物学阐释。但是,目前的中药转录组研究仍面临着分子基础薄弱,测序投资成本高,分析人员紧缺等困难。未来,伴随测序技术的发展与完善,转录组与蛋白质组、代谢组等组学的联合应用,将为开创高通量筛选与高效率研发相结合的新型中药产业发展模式奠定坚实的基础。

    [关键词]中药; 转录组; 西洋参; 金银花

    中药经过数千年的积累沉淀,承载着丰富的中医理论。近年来,中药研究进展飞速,不仅为医药产业提供了巨大的新药创制资源,更成为未来多靶点药物研发的源泉,弥补了西药治疗位点单一的不足。目前,指纹图谱技术和质谱色谱技术的应用,促进了中药有效成分的发现与鉴定[1-2]。然而尚有许多中医药理论因缺少现代自然科学的支撑和验证,难以被社会所接受。转录组(transcriptome)是指特定生物体在某种状态下所有基因转录产物的总和,转录组研究属于功能基因组学研究的范畴,是连接基因组与蛋白质组的纽带。转录组研究着重于功能基因的表达,阐述生物学过程中的分子机理,已经成为生物学领域较为成熟的研究手段。应用高通量转录组分析技术,可以从基因层面上解读中医药的现代内涵,阐述中药有效成分的代谢通路,为高通量发掘新型活性药物成分奠定了坚实的基础。自2009年以来,已有青蒿Artemisia annua[3]、西洋参Panax quinquefolius[4]、淫羊藿Epimedium Sagittatum[5]、金银花Lonicera japonica[6-7]等数种传统中药材进行了高通量转录组的测序和分析。本文综述了转录组技术在中药领域的研究进展,对金银花、西洋参等代表物种的研究进行了详细阐述,总结了中药转录组分析的特色与不足,并对中药转录组的研究进行展望。

    1中药转录组研究

    1.1中药转录组研究概况

    截至2014年1月,已有17种中药进行了高通量转录组的研究。其中,开展研究最早的是青蒿A. annua[3],随后,中药转录组研究发展迅猛,2012年,有8种中药进行了转录组研究(表1)。除了胡黄连Picrorhiza kurrooa[8]和百合Lilium regale[9],剩余的15种中药的转录组测序工作均由中国人完成,体现了我国在中药研究领域的霸主地位。早期的转录组测序主要以GS FLXTM System和GS FLXTM Titanium System平台为主;到2012年,主要的测序平台变为Illumina HiSeqTM 2000;只有罗汉果Siraitia grosvenorii[10]和金银花L. japonica[6]的转录组研究采用了Illumina GAⅡ platform平台。金银花L. japonica[6]注释得到的基因数目最少,为5 330~6 591个,梅花鹿鹿茸Cervus nippon [14]注释得到的基因数目最多,为138 642个。梅花鹿鹿茸转录组注释得到了较多的基因,除了其本身基因丰富、可变剪切较多之外,还可能是由于其转录组的拼接效果较差,contig的N50为90 bp,使得原本由多个外显子构成的基因注释成了分别的几个较短的基因,从而使得注释得到的基因数目偏多。

    1.2中药转录组的测序平台比较

    表1可知,中药转录组研究的两大平台为Roche公司的GS FLXTM平台和Illumina公司的HiSeqTM 2000平台。GS FLXTM平台的历史可以追溯到2005年,454公司推出了基于焦磷酸测序法的高通量基因组测序系统[22],这一技术开创了边合成边测序(sequencing-by-synthesis, SBS)的先河,其后的第二代基因组测序系统——Genome Sequencer FLXTM System(GS FLX)[23]就是在此基础上建立起来的(图1)。454公司被Roche公司收购之后,于2008 年10 月,推出了全新的测序试剂——GS FLXTM Titanium,全面提升了测序的准确性、读长和测序通量。目前,Roche 454 GS FLXTM Titanium System每次运行能产生100万条序列,平均读长能达到400~600 nt,且第400个碱基的准确率能达到99%。一次运行所需时间不到10 h,便能获得40 Gb左右的测序数据。HiSeqTM 2000平台是Illumina公司Solexa平台中最为成功的商业化型号,一次运行可以获得60亿条序列,总数据量达到540~600 Gb,弥补了平均读长较短的不足[24]。其测序的原理基于桥式PCR,HiSeqTM 2000平台在此基础上改进了聚合酶,并使用甲酰胺变性,提高了桥式PCR的扩增效率(图1)。另外,HiSeqTM 2000平台价格相对较低,因此,成为目前应用最为广泛的二代测序平台。(张召宝 侯林 潘晴 王绪敏 崔清华 田景振 马鲁豫)
1 2 3 4 5 6下一页
    婵犵數鍎戠徊钘壝洪悩璇茬婵犻潧娲ら閬嶆煕濞戝崬鏋ゆい鈺冨厴閺屾稑鈽夐崡鐐差潾闁哄鏅滃Λ鍐蓟濞戞ǚ鏋庨煫鍥ㄦ尨閸嬫挻绂掔€n亞鍔﹀銈嗗坊閸嬫捇鏌涢悩宕囥€掓俊鍙夊姇閳规垿宕堕埞鐐亙闁诲骸绠嶉崕鍗炍涘☉銏犵劦妞ゆ帒顦悘锔筋殽閻愬樊鍎旀鐐叉喘椤㈡棃宕ㄩ鐐靛搸婵犵數鍋犻幓顏嗗緤閹灐娲箣閻樺吀绗夐梺鎸庣箓閹峰宕甸崼婢棃鏁傜粵瀣妼闂佸摜鍋為幐鎶藉蓟閺囥垹骞㈤柡鍥╁Т婵′粙鏌i姀鈺佺仩缂傚秴锕獮濠囨晸閻樿尙鐤€濡炪倖鎸鹃崑鐔哥閹扮増鈷戦柛锔诲帎閻熸噴娲Χ閸ヮ煈娼熼梺鍐叉惈閹冲氦绻氶梻浣呵归張顒傜矙閹烘鍊垫い鏂垮⒔绾惧ジ鏌¢崘銊モ偓绋挎毄濠电姭鎷冮崟鍨杹閻庢鍠栭悥鐓庣暦濮椻偓婵℃瓕顦抽柛鎾村灦缁绘稓鈧稒岣块惌濠偽旈悩鍙夋喐闁轰緡鍣i、鏇㈡晜閽樺鈧稑鈹戦敍鍕粶濠⒀呮櫕缁瑦绻濋崶銊у幐婵犮垼娉涢敃銈夊汲閺囩喐鍙忛柣鐔煎亰濡偓闂佽桨绀佺粔鎾偩濠靛绀冩い顓熷灣閹寸兘姊绘担绛嬪殐闁哥姵鎹囧畷婵婄疀濞戣鲸鏅g紓鍌欑劍宀e潡鍩㈤弮鍫熺厽闁瑰鍎戞笟娑㈡煕閺傚灝鏆i柡宀嬬節瀹曟帒顫濋鐘靛幀缂傚倷鐒﹂〃鍛此囬柆宥呯劦妞ゆ帒鍠氬ḿ鎰磼椤旇偐绠婚柨婵堝仱閺佸啴宕掑鍗炴憢闂佽崵濞€缂傛艾鈻嶉敐鍥╃煋闁割煈鍠撻埀顒佸笒椤繈顢橀悩顐n潔闂備線娼уú銈吤洪妸鈺佺劦妞ゆ帒鍋嗛弨鐗堢箾婢跺娲寸€规洏鍨芥俊鍫曞炊閵娿儺浼曢柣鐔哥矌婢ф鏁Δ鍜冪稏濠㈣埖鍔栭崑锝夋煕閵夘垰顩☉鎾瑰皺缁辨帗娼忛妸褏鐣奸梺褰掝棑婵炩偓闁诡喗绮撻幐濠冨緞婢跺瞼姊炬繝鐢靛仜椤曨厽鎱ㄦィ鍐ㄦ槬闁哄稁鍘奸崹鍌炴煏婵炵偓娅嗛柛瀣ㄥ妼闇夐柨婵嗘噹閺嗙喐淇婇姘卞ⅵ婵﹥妞介、鏇㈡晲閸℃瑦顓婚梻浣虹帛閹碱偆鎹㈠┑瀣祦閻庯綆鍠栫粻锝嗙節婵犲倸顏柟鏋姂濮婃椽骞愭惔锝傛闂佸搫鐗滈崜鐔风暦閻熸壋鍫柛鏇ㄥ弾濞村嫬顪冮妶鍡楃瑐闁绘帪绠撳鎶筋敂閸喓鍘遍梺鐟版惈缁夋潙鐣甸崱娑欑厓鐟滄粓宕滃顒夋僵闁靛ň鏅滈崑鍌炴煥閻斿搫孝閻熸瑱绠撻獮鏍箹椤撶偟浠紓浣插亾濠㈣泛鈯曡ぐ鎺戠闁稿繗鍋愬▓銈夋⒑缂佹ḿ绠栭柣鈺婂灠閻g兘鏁撻悩鑼槰闂佽偐鈷堥崜姘额敊閹达附鈷戦悹鍥b偓铏亖闂佸憡鏌ㄦ鎼佸煝閹捐绠i柣鎰綑椤庢挸鈹戦悩璇у伐闁哥噥鍨堕獮鍡涘磼濮n厼缍婇幃鈺呭箵閹烘繂濡锋繝鐢靛Л閸嬫捇鏌熷▓鍨灓缁鹃箖绠栭弻鐔衡偓鐢登瑰暩閻熸粎澧楅悡锟犲蓟濞戙垹绠抽柡鍌氱氨閺嬪懎鈹戦悙鍙夊櫣闂佸府绲炬穱濠囧箻椤旇姤娅㈤梺璺ㄥ櫐閹凤拷

   闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙婵☆偅锕㈤弻娑㈠Ψ閵忊剝鐝栭悷婊冨簻閹凤拷  闂傚倷鑳舵灙缂佺粯顨呴埢宥夊即閵忕姵鐎梺缁樺姉閸庛倝宕曞畝鍕厽闁逛即娼ф晶顔姐亜鎼搭垱瀚�  闂備浇宕垫慨鏉懨洪妶鍥e亾濮樼厧鐏︽い銏$懇楠炲鏁冮埀顒傜矆閸曨垱鐓熸俊顖濐嚙缁茶崵绱撳蹇斿  闂傚倷鑳堕幊鎾诲触鐎n剙鍨濋幖娣妼绾惧ジ鏌曟繛鐐珔闁告濞婇弻鈩冨緞鐎n亞鍔稿┑鈽嗗灲閹凤拷