用EM算法改进鸟枪法蛋白质鉴定中的无标记定量方法
EM算法,鸟枪法,蛋白无标记定量,质谱数,,EM算法,鸟枪法,蛋白无标记定量,质谱数,关键词EM算法,鸟枪法,蛋白无标记定量,质谱数,1引言,2实验部分,3结果与讨论,References
摘 要 蛋白质定量是探索疾病发生发展状况和寻找新药靶标的重要手段。在shotgun蛋白组学中,目前常用定量方法包括综合同位素标记后的质谱峰强度方法和无标记定量方法。根据数据类型无标记定量方法可以分为两类:基于鉴定蛋白的质谱数的方法和基于质谱峰强度的方法。本研究主要用EM算法改进基于鉴定蛋白质谱数的定量方法,并用免疫印迹实验获得的酵母全蛋白的丰度来验证EM算法改进后定量的有效性。结果表明,改进后的质谱数和蛋白丰度的相关性比改进前有一定的提高。同时,利用这些数据对主要的几种基于鉴定蛋白的质谱数的模型进行了比较,发现PAI模型最好,SpS模型次之,emPAI模型最不适合于蛋白质定量。关键词 EM算法,鸟枪法,蛋白无标记定量,质谱数
1 引 言
蛋白定量是比较蛋白质组学研究的基础。目前鸟枪法(shotgun)在蛋白质组学中的常用定量方法有综合同位素标记后的质谱峰强度方法和无标记定量方法。无标记定量方法是直接利用蛋白质鉴定中产生的数据,比如样品酶切后经LCMS/MS产生的质谱数据。根据数据类型,无标记定量方法又可分为两类:基于鉴定蛋白肽段数的方法和基于质谱峰强度的方法\[1\]。Shotgun蛋白质组学研究的实验技术流程一般为样品(蛋白混合物)直接酶切后,用色谱分离,而后进入质谱进行鉴定\[2\]。本实验主要进行鉴定蛋白的质谱数的定量方法研究。这类方法目前常用的模型包括SpS模型(spectrum sampling)\[3\]、PMSS模型(peptide match score summation)\[4,5\]、PAI(protein abundance index)\[6\]及emPAI(exponentially modified PAI)\[7\]等。SpS和PMSS模型是用一个蛋白的所有肽段的质谱数总和作为该蛋白的相对丰度,PMSS模型是应用OLAV\[8\]的肽段打分结果计算的。由于没有相应软件支持,故本文不予讨论;PAI模型是用检测到的蛋白的鉴定质谱数除以蛋白的理论酶切肽段数得到; emPAI则是PAI模型的转换,为10PAI1。高等生物中存在着很普遍的多个蛋白共有一种或多种肽段的现象。在利用质谱数进行蛋白定量时,就需要对这种肽段的质谱数进行几个蛋白间的分配。而目前常用的模型中都没有考虑这个问题,也没有合理分配这些质谱数。本研究借鉴了ProteinProphet中肽段概率分配的expectation maximization (EM)算法 \[9\],对肽段的质谱数进行不同蛋白间的分配 ......
您现在查看是摘要页,全文长 11843 字符。