基于模糊支持向量机的膜蛋白折叠类型预测(2)
hydrophobicity scale,KD)、 平均极性(Meanpolarity,MP)和溶剂化自由能(Solvation freeenergy,SFE)等3种指数进行计算。
结合3种特征以后,一条蛋白质序列可以表示为下列特征向量:
这是一个(420+3*ψ)维的向量,在本文测试中,取P=60,oJ=10,对于序列长度不到60个氨基酸残基的蛋白质序列,将序列长度自动补齐为60个残基,且补齐的残基编码值取0,这样,由一条蛋白质序列得到一个600维的特征向量作为FSVM分类器输入。
1.3 FSVM算法
SVM是统计学习理论中的核心内容,它基于VC维理论和结构风险最小化原理,在很大程度上克服了传统机器学习中的维数灾难以及局部极小等问题,传统的SVM是针对两类分类问题而设计的,设输入的样本数据为n,则训练样本为:Sn=((x1,y1),(x2,x2),…,(xn,yn)) ......
您现在查看是摘要页,全文长 4477 字符。