HPV的基因组是双链闭环DNA,其长度为7200-8000bp,分子量约5.2×10KDa。一般说来,HPV基因组可以分为3个区段:早期区、晚期区及上游调节区(URR)或长控制区(LCR)或非编码区(NCR)。早期区与晚期区约有10个主要开放读码框架(ORF),约占基因组的60%,均在双链DNA的一条链上编码,早期区约占4Kb,编码5-8个开放阅读框架,依次为E6、E7、E1(E8)、E2 、E4 (E3 )、E5 ,早期区的功能涉及DNA复制、转录调节及细胞转化,晚期区也称L区,约3000bp,有两个主要ORF,分别称为L1,L2,编码病毒自身结构蛋白,与E区的转录方向一致。非编码区即URR区,位于L1和E6之间,长约1000bp,含有一些AT丰富区,含有内含子,增强子序列。HPV-16在URR区保守序列为TTTGGCTT,这也是角朊细胞依赖性增强子的一部分,与HPV的表皮向性有关,此外,其还可能使HPV-16DNA 以环状结构存在于癌细胞中。
(一)早期转录及早期蛋白
E1ORF 3′端变异可以使细胞发生形态学变化,并使DNA呈整合状态,游离DNA复制的能力可被另一DNA上的野生型E1ORF所互补,这就表明变异区具有一种反式作用的功能。E1ORF5′端具有游离DNA复制的负调节功能,此外E1蛋白的一个区段在氨基酸水平与SV40大T抗原有较强的同源性,这一区域位于E1蛋白C端的1/2,而大T抗原参与核苷酸结合,并具有ATP酶活性因此提示E1参与病毒DNA的复制。E2ORF编码一种早期区的反式激活因子,后者又可能作用于URR区,而同一E2ORF的3′端编码一种可抑制上述反式激活因子的蛋白,所以E2ORF编码着2个在功能上相拮抗的蛋白。E7ORF含有一个转化基因,可以使大鼠血管3Y1细胞转化。此外,E7尚与调节基因拷贝数有关。
(二)晚期转录及晚期蛋白
晚期区编码L1和L2蛋白,L1是主要的核壳蛋白,L1的抗体可与成熟病毒的核衣壳相作用,L2的作用则尚未明晰,可能是次要的核蛋白,而且可能与病毒的宿主选择性有关。晚期蛋白的多聚腺苷酸信号位于L1ORF之后。
URR区:是乳头瘤病毒基因组中变异较大的一个区段,甚至在密切相关的型别之间也有差异。所有型别的HPV在URR区段中都含有重复序列,可增强基因转录,进而影响病毒的致病力。
, http://www.100md.com