川芎转录组SSR分析与ESTSSR标记的开发(3)
将含有SSR的unigene序列比对Nr和Nt数据库进行注释,结果显示2 201个unigene在Nr数据库中具有同源匹配信息,782个unigene在Nt数据库具有同源匹配信息,分别占比对序列的61.1%,21.7%。在与Nr数据库进行同源比对时,比对最多的物种为胡萝卜,共计1 655条,占比对序列的45.9%。同时将unigene与SwissProt(蛋白数据库)、TrEMBL、Pfam(蛋白结构域注释分类)、CDD数据库进行比对和注释,注释结果显示分别有1 302,2 009,1 110,1 318个基因被注释,占比对序列的36.2%,55.8%,30.8%,36.6%。随后将含有SSR的unigene按GO(Gene Ontology)和KOG(Eukaryotic Orthologous Groups of proteins)分类系统进行分类(图1)。SSR所在序列共计分为25个KOG类,最多一类为蛋白转录后修饰139个,其次为一般功能预测118个,最少的一类为细胞运动1个,其次为未知蛋白2个。在GO分类中,将unigene分为细胞组分、分子功能和生物学过程3类。在GO分类中,进一步将3大功能细分为49个小类。在生物学过程中细胞过程最多(25.6%) ......
您现在查看是摘要页,全文长 4793 字符。