当前位置: 首页 > 期刊 > 《《现代生物医学进展》》 > 2008年第4期 > 正文
编号:11734833
支持向量机及组合预测在蛋白质四级结构分类中的应用
http://www.100md.com 2008年2月15日 谭显胜 袁哲明 周铁军 熊洁仪 王春娟
第1页

    参见附件(2341KB,4页)。

    谭显胜 袁哲明 周铁军 熊洁仪 王春娟 湖南农业大学生物安全科学技术学院 湖南农业大学生物安全科学技术学院 湖南农业大学理学院 湖南农业大学生物安全科学技术学院 湖南农业大学生物安全科学技术学院

    【摘要】目的:基于支持向量机建立一个自动化识别新肽链四级结构的方法,提高现有方法的识别精度。方法:改进4种已有的蛋白质一级序列特征值提取方法,采用线性和非线性组合预测方法建立一个有效的组合预测模型。结果:以同源二聚体及非同源二聚体为例,对4种特征值提取方法进行改进后其分类精度均提升了2~3%;进一步实施线性与非线性组合预测后,其分类精度再次提高了2~3%,使独立测试集的分类精度达到了90%以上。结论:4种特征值提取方法均较好地反应出蛋白质一级序列包含四级结构信息,组合预测方法能有效地集多种特征值提取方法优势于一体。

    【关键词】 蛋白质四级结构 分类 支持向量机 组合预测

    【基金】国家自然科学基金(No.30570351) 教育部新世纪优秀人才支持计划(NCET-06-0710)

    【分类号】Q51

    前言随着人类基因组计划的顺利完成,越来越多的蛋白质序列被测定出来,而通过实验确定蛋白质的结构和功能费时、费力、费钱,两者之间的差距有迅速扩大之势,因此建立一个自动化识别新肤链特征的方法已势在必行。基于统计学习理论的支持向量机(Support veetor Maehines,SvM
------
     摘要目的:基于支持向量机建立一个自动化识别新肽链四级结构的方法,提高现有方法的识别精度。方法:改进4 种已有的蛋白质一级序列特征值提取方法,采用线性和非线性组合预测方法建立一个有效的组合预测模型。结果:以同源二聚体及非同源二聚体为例,对4 种特征值提取方法进行改进后其分类精度均提升了2~3 %;进一步实施线性与非线性组合预测后,其分类精度再次提高了2~3%,使独立测试集的分类精度达到了90 %以上。结论:4种特征值提取方法均较好地反应出蛋白质一级序列包含四级结构信息,组合预测方法能有效地集多种特征值提取方法优势于一体。

    关键词:蛋白质四级结构;分类;支持向量机;组合预测

您现在查看是摘要介绍页,详见PDF附件(2341KB,4页)