基于机器学习方法的MHC结合肽的预测分析研究(1)
基于机器学习方法的MHC结合肽的预测分析研究,增量式SVM,MHC结合MHC(major,histocompatibility,complex,主要组织相容
第1页 |
参见附件。
【摘要】随着艾滋病和抗生素抵制的加剧,人们对疫苗研究越来越关注。通过表位短肽与主要组织相容性复合物(MHC)分子结合,激发免疫应答,由此设计和研发出具有应用价值的肽疫苗,准确预测肽段与MHC结合能力是关键技术之一。采用基于机器学习的支持向量机(SVM)算法对MHC结合肽进行预测分析,构造增量式SVM训练模型,然后将算法嵌入到Web平台搭建结合肽预测系统。
【关键词】机器学习;增量式SVM;MHC结合MHC(major histocompatibility complex,主要组织相容性复合体)是由一组高度多肽性基因组成的染色体区域(糖蛋白)[1]。根据细胞免疫学理论,多肽与MHC分子结合是其被T细胞识别的先决条件,肽结合到MHC并且被T细胞受体(TCR)辨认出,其结合能力决定了免疫原性。多肽与等位基因的结合以特定残疾在特定位点的出现为基础,这些残基为锚着残基,位点成为锚着位点[2]。SVM(support vector machine,支持向量机)是一种有监督的机器学习方法,来被使用在微阵列数据分类、蛋白质结构预测和其他生物学问题。研究资料表明,支持向量机在MHC肽结合预测上已经表现出比人工神经网络更好的效果。 MHC分子与肽的结合具有高度特异性,但这些不同的肽在某些位置上具有共同的特点,即有相似化学性质的氨基酸,其中在肽与MHC分子结合时起决定作用的位点称为锚定位。使用SVM算法对MHC结合肽的规律进行学习和预测,搭建一个嵌入SVM算法的基于Web可预测MHC分子和多肽结合能力的预测平台,可为疫苗的设计、降低移植排斥反应的研究等提供帮助。1基于SVM的机器学习法
1.1机器学习法机器学习一般被定义为对能通过经验自动改进的计算机算法的研究,是用数据或以往的经验,以此优化计算机程序的性能标准。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。传统的模式识别或人工神经网络方法都要求较多的训练样本,机器学习方法的研究遇到一些困难,比如如何确定网络结构、过拟合与欠拟合问题、局部极小点问题等[3]。近十年来,有限样本情况下的机器学习理论逐渐成熟 ......
您现在查看是摘要介绍页,详见PDF附件。