哈医大生物信息学研究结硕果——创立复杂疾病基因定位系列方法
本报黑龙江讯 哈尔滨医科大学生物信息学系李霞、郭政教授等在国家自然科学基金资助下,历时3年,圆满地完成了“多基因复杂遗传疾病基因作图的模式识别与特征提取技术”等课题研究。其中,他们在针对复杂疾病相关基因模式识别方法的系统研究中,建立了具有开创意义的同胞对基因连锁分析模式识别、同胞对方差连锁分析法定位、离散型人类复杂疾病基因识别等方法,并与生物信息学技术相结合,向人们提供了遗传标记数据分析的系统化、最优化策略。该研究的主要成果,已分别发表在国内外著名的《NucleicAcids Research》、《Ameri-can Journal o fHuman Genetics》、《Genomics》、《中国科学》等生命科学杂志上。;, http://www.100md.com
人类多数(80%)疾病属于复杂疾病,如各种癌症、糖尿病、高血压、动脉粥样硬化等,这些疾病一般由多基因与环境交互作用而产生,其基因型与表型间没有简单的对应关系,其发病机理一般不能通过某一个基因的突变、单一的基因产物或通路的行为来解释,而是要从多基因与环境交互作用方面去探寻。在该项研究中,李霞教授等建立了采用模式特征提取技术来研究多基因复杂疾病的基因作图方法和基于同胞对方差的分析方法,并以基因定位离散型人类复杂疾病。这些开创性的研究成果,能有效地反映多基因互作、多基因与环境互作的影响。该研究显示,上述方法是用于离散型人类复杂疾病基因定位的有效方法。;, http://www.100md.com
DNA微阵列技术可以快速、并行、高效地检测基因表达水平,是一条具有突破意义的寻找复杂性状相关基因的新途径。李霞、郭政教授等将其原计划开展的基于标记遗传家系数据基因连锁定位的研究,扩展到基于基因芯片表达的特征基因挖掘的层面。他们视基因上调和下调的表达谱为第二类标记,来研究识别疾病相关特征基因和对疾病有鉴别力的特征基因,以及可对疾病分型的新方法;建立特征基因之间的相关网络互作关系,并结合GO(GeneOntology)和代谢通路KEGG(Kyoto Encyclopedia of Genes and Genomes)等功能分子生物学数据库的信息,来预测、解释疾病相关特征基因的功能。他们还利用其创新的特征基因识别技术,对已有的结肠癌、白血病、淋巴瘤等疾病的基因研究数据进行了特征基因发现、疾病基因识别的深度信息再挖掘。针对疾病的多类表现和疾病类别的层次性,他们还提出了多类动态特征基因挖掘与融合的新方法,有效地解决了特征基因的局部性、稳定性、有效性和生物学的相关性,以及特征基因的生物学可解释性等问题。同时,他们提出了基于耦合双向聚类技术的疾病遗传异质性分析策略;提出了利用部分有意义的基因信号可发现疾病亚型的观点。这种分析策略克服了传统的双向聚类方法或单向聚类方法的局限性,弥补了目前对肿瘤的分型主要依赖于组织学及形态学特征的不足。这些研究成果在方法学上具有创新意义,为寻找癌症等多基因复杂疾病相关基因,发展无监督与有监督高维数据基因挖掘方法,以及为根据基因表达谱来识别与确认疾病亚型的研究,建立了新的理论基础。;, http://www.100md.com
李霞教授认为,用于高通量疾病靶点发现的生物信息挖掘新技术,突破了以传统技术手段孤立地分析单个基因或筛选单个蛋白的局限,而采用结合生物学知识的数据挖掘法,多角度、多层次(包括序列、SNP、基因表达和蛋白质产物等)地分析、挖掘疾病相关靶点以及靶点分子间的互作关系和最优疾病多靶联合作用的机制,则具有重要的实际应用意义。;, http://www.100md.com
权威专家认为,上述人类复杂疾病特征基因挖掘方法的诞生,标志着中国生物信息学家在整合数理科学和生命科学等交叉学科方面,已跻身于世界先进行列,同时也填补了我国利用新一代高通量生物数据(如遗传标记、DNA芯片、蛋白质芯片、代谢芯片和药物靶筛选芯片)探索生命奥秘的一项空白。;, http://www.100md.com
(聂松义)(聂松义 )
人类多数(80%)疾病属于复杂疾病,如各种癌症、糖尿病、高血压、动脉粥样硬化等,这些疾病一般由多基因与环境交互作用而产生,其基因型与表型间没有简单的对应关系,其发病机理一般不能通过某一个基因的突变、单一的基因产物或通路的行为来解释,而是要从多基因与环境交互作用方面去探寻。在该项研究中,李霞教授等建立了采用模式特征提取技术来研究多基因复杂疾病的基因作图方法和基于同胞对方差的分析方法,并以基因定位离散型人类复杂疾病。这些开创性的研究成果,能有效地反映多基因互作、多基因与环境互作的影响。该研究显示,上述方法是用于离散型人类复杂疾病基因定位的有效方法。;, http://www.100md.com
DNA微阵列技术可以快速、并行、高效地检测基因表达水平,是一条具有突破意义的寻找复杂性状相关基因的新途径。李霞、郭政教授等将其原计划开展的基于标记遗传家系数据基因连锁定位的研究,扩展到基于基因芯片表达的特征基因挖掘的层面。他们视基因上调和下调的表达谱为第二类标记,来研究识别疾病相关特征基因和对疾病有鉴别力的特征基因,以及可对疾病分型的新方法;建立特征基因之间的相关网络互作关系,并结合GO(GeneOntology)和代谢通路KEGG(Kyoto Encyclopedia of Genes and Genomes)等功能分子生物学数据库的信息,来预测、解释疾病相关特征基因的功能。他们还利用其创新的特征基因识别技术,对已有的结肠癌、白血病、淋巴瘤等疾病的基因研究数据进行了特征基因发现、疾病基因识别的深度信息再挖掘。针对疾病的多类表现和疾病类别的层次性,他们还提出了多类动态特征基因挖掘与融合的新方法,有效地解决了特征基因的局部性、稳定性、有效性和生物学的相关性,以及特征基因的生物学可解释性等问题。同时,他们提出了基于耦合双向聚类技术的疾病遗传异质性分析策略;提出了利用部分有意义的基因信号可发现疾病亚型的观点。这种分析策略克服了传统的双向聚类方法或单向聚类方法的局限性,弥补了目前对肿瘤的分型主要依赖于组织学及形态学特征的不足。这些研究成果在方法学上具有创新意义,为寻找癌症等多基因复杂疾病相关基因,发展无监督与有监督高维数据基因挖掘方法,以及为根据基因表达谱来识别与确认疾病亚型的研究,建立了新的理论基础。;, http://www.100md.com
李霞教授认为,用于高通量疾病靶点发现的生物信息挖掘新技术,突破了以传统技术手段孤立地分析单个基因或筛选单个蛋白的局限,而采用结合生物学知识的数据挖掘法,多角度、多层次(包括序列、SNP、基因表达和蛋白质产物等)地分析、挖掘疾病相关靶点以及靶点分子间的互作关系和最优疾病多靶联合作用的机制,则具有重要的实际应用意义。;, http://www.100md.com
权威专家认为,上述人类复杂疾病特征基因挖掘方法的诞生,标志着中国生物信息学家在整合数理科学和生命科学等交叉学科方面,已跻身于世界先进行列,同时也填补了我国利用新一代高通量生物数据(如遗传标记、DNA芯片、蛋白质芯片、代谢芯片和药物靶筛选芯片)探索生命奥秘的一项空白。;, http://www.100md.com
(聂松义)(聂松义 )