利用蛋白质相互作用关系改善基因芯片缺失数据估计的精度
第4页 |
第1页 |
参见附件(3062KB,6页)。
倪青山 王广云 邱浪波 强波 王正志 国防科技大学机电工程与自动化学院 国防科技大学机电工程与自动化学院 空军工程大学电讯工程学院 国防科技大学机电工程与自动化学院 国防科技大学机电工程与自动化学院
【摘要】针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法.将蛋白质间的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据这个新的相似性度量标准为含有缺失数据的基因选择更为合适的用于估计缺失值的基因集合.将新的相似性度量标准与传统的KNNimpute、LLSimpute方法相结合,描述了对应的改进算法PPI-KNNimpute、PPI-LLSimpute.对真实的数据集测试表明,蛋白质相互作用信息能有效改善基因缺失数据估计的精度.
【关键词】 基因芯片 缺失值估计 蛋白质相互作用
【基金】国家自然科学基金资助项目(60471003)
【分类号】Q789
基因芯片能够对不同条件下成千上万的基因的表达情况进行检测,在分子生物学、生物医学等领域已得到了广泛应用,例如通过对基因表达数据进行分析,寻找新的药物、区分不同的癌症显型、研究特定细胞环境下基因间的调控关系等[1,2].在对基因表达数据进行分析的过程中,通常采用统
------
摘要:针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法。将蛋白质问的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据这个新的相似性度量标准为含有缺失数据的基因选择更为合适的用于估计缺失值的基因集合。将新的相似性度量标准与传统的KNNimpute、LLSimpute方法相结合,描述了对应的改进算法PPI-KNNimpute、PPI-LLSimpute。对真实的数据集测试表明,蛋白质相互作用信息能有效改善基因缺失数据估计的精度。
关键词:基因芯片;缺失值估计;蛋白质相互作用
中图分类号:Q-332
文献标识码:A
文章编号:1007-7847(2008)02-0104-06
您现在查看是摘要介绍页,详见PDF附件(3062KB,6页)。