短串联重复序列在法医学中的应用
http://www.100md.com
法医学杂志 2000年第1期第16卷 综述
作者:孟海英 侯一平 陈国弟 吴瑾 李英碧
单位:华西医科大学法医学院,四川成都 610041
关键词:
法医学杂志000136
[中图分类号]DF795.2 [文献标识码]A
[文章编号]1004-5619(2000)01-0055-04
1 STR的概念
短串联重复序列(short tandem repeat,简称STR),也叫微卫星DNA(microsatellite),或简单重复序列(simple sequence repeat,简称SSR),是一类广泛存在于真核生物基因组中的DNA串联重复序列。其核心序列为2~6bp[1],重复次数通常在15~30次。少数学者倾向于称核心序列2bp的为微卫星DNA,3~5bp的为STR[2],本文以前一种认识为基础。DNA重复序列家族成员之间的关系见表1。
, 百拇医药
表1 DNA重复序列家族成员特点比较
卫星DNA
(satellite)
小卫星DNA
(minisatellite)
微卫星DNA
(microsatellite)
核心序列长度
5~100bp
15~70bp
2~6bp
片段长度
, 百拇医药
<100Mb
0.5~30Kb
约200bp
是否具有长度多态性
多数没有
多数具有多态性
多数具有多态性
分布
位于染色体着丝粒、端粒附近的异染色质区
位于近染色体着丝粒和端粒区
位于常染色质区
最早发现STR是由于在真核生物基因组中发现了由dT-dG串联重复组成的长度可变序列[3]。以后的研究表明,STR在基因组中广泛分布,其中以dA-dC,dA-dA-dN,dC-dA和dA-dG为核心序列的STR在基因组中分布最为广泛,如(dC-dA)n在人类基因组中就有35000到100000个,以最保守的估计,每100Kb就有一个(dC-dA)n基因座。多数的STR基因座具有多态性[4],其高度多态性主要源于核心序列重复次数的个体间差异,这种差异在基因传递的过程中一般遵循孟德尔共显性遗传规律[5]。STR作为一个重要的遗传标记系统,已广泛应用于肿瘤生化研究、法医学个体识别、亲权鉴定和群体遗传学分析等领域。
, http://www.100md.com
2 STR的命名
STR的多态性一般是指由于核心序列重复次数不同而构成的长度多态性,但测序研究结果证明STR也存在着序列多态性。在实际应用中序列多态性的检测手段繁琐,对仪器、设备要求高,较少采用,而长度多态性检测已被广泛应用于法医学个人识别[6]和亲权鉴定[5]。
国际法医学者研究STR始于1993年,当年在意大利威尼斯召开的第15届国际法医血液遗传学DNA鉴定委员会(the DNA commission of the international society of forensic haemogenetics,简称ISFH)国际会议上[7],一些作者报道了这方面的研究成果,该学会DNA委员会提出了基于短串联重复序列的法医DNA分型推荐方案,建议用核心序列重复数命名STR的等位基因,用小数点后的数表示不完整核心序列的bp数,如HUMTH01[8]的等位基因9.3就是在(TCAT)n的重复序列中包含了CAT这样一个3bp的不完整的核心序列。但是,由于各作者在报道STR基因座时可使用两条互补链中的任意一条,而且可定义不同的核心序列,因此在STR命名上仍然存在一定程度的混乱。如
, 百拇医药
1.5'-GGTCATCATCATGG-3'3×TCA
2.5'-GGTCATCATCATGG-3'3×CAT
在以上的例子中,由于阅读重复序列的起始点不同,使对同一序列的核心序列的认识发生了分歧。针对这些问题ISFH于1997年再次召开国际会议讨论STR基因座的命名。会议通过DNA的序列从5'到3'方向阅读,编码蛋白质的基因内STR以蛋白质编码链为准;与蛋白质编码基因无关的STR基因座以最初公开发表的资料使用的链为依据命名。对于以上提到的由于阅读重复序列的起始点不同,使对同一重复序列的核心序列命名不同,ISFH建议以5'端第一个包含在重复序列中的核苷酸命名STR基因座[9]。
3 STR的优点
PCR扩增STR基因座仅需少量模板DNA,灵敏度比传统的DNA指纹高得多。另外STR扩增片段长度较短,对于法医常遇到的仅含降解DNA的陈旧性斑痕,STR的扩增效率比传统的DNA指纹更高。因此,STR分型被认为是第二代法医DNA指纹技术的核心,是目前国内外法医学个体识别和亲权鉴定的主要技术发展方向。下面就分述STR在法医学鉴定中的一些优点。
, 百拇医药
3.1 STR基因座的个体识别机率及非父排除率高
STR在人类基因组中广泛分布,与传统的蛋白质遗传标记相比,等位基因多,杂合度高,因此多个STR基因座联合检测时,个体识别机率和非父排除率很高。从1904年第一例应用生物性检材进行个人识别的案例被报道以来,大量的红细胞抗原、同工酶标记、血清蛋白标记以及人类白细胞抗原(human leukocyte antigens,简称HLA)蛋白已被用于法医实践中。和这些基因表达产物相比,DNA在检材中更稳定,可保留更长的时间,因此更适用于法医学鉴定。STR检测和以往的DNA水平的检测相比,由于它在人类基因组中分布极为广泛,且片段小,等位基因多,杂合度高,如在Did等人研究的5264个STR基因座中93%的杂合度大于0.5,58%的杂合度大于0.7,平均杂合度为0.7[10]。因此不同个体基因型不同的可能性更大,随机个体与罪犯之间由于机会造成的基因型相同的可能性大大减小。如有报道显示,两个无关个体在14个STR基因座基因型完全相同的可能性仅为1×10-14[11],即理论上说,在目前地球上60亿人口中没有任何两个无关个体在这14个STR基因座基因型完全相同。
, http://www.100md.com
3.2 适用于各种来源的生物性检材,检测灵敏度和成功率高
由于STR的片段长度较短,一般在100~300bp,又很容易通过PCR扩增、电泳分型,因此比绝大多数其它遗传标记系统更适用于高度降解检材的检测;其中三核苷酸、四核苷酸重复PCR扩增结果更稳定,产生的附加带、影子带少,容易分型,所以在法医学中得到了最为广泛的应用[4]。本实验室在用STR基因座检测血痕、唾液斑、精液斑、人体组织等进行个体同一认定、亲权鉴定时都取得了成功。更为令人振奋的是,在末代沙皇一家遗骨的鉴定中,英国内务部成功地利用5个STR基因座对挖掘出来的75年以前的尸骨进行了检测,在DNA含量仅有50pg或更少的情况下,认定了9付骨骼的性别及亲属关系[12],正是由于他们对如此古老(高度降解)微量检材的检测取得令人满意的结果,引起了国际社会的普遍关注,使人们对STR在法医学鉴定中的应用充满信心。美国对博物馆中动物标本及琥珀等样本所进行的STR分析[13-15],更证实了它在法医学鉴定及人类学研究中强大的鉴别能力。
, 百拇医药
4 STR的缺点
正当各国法医工作者竞相将STR检测应用于司法实践中时,1994~1995年在美国洛杉矶审判的,被媒体称为“世纪审判”的辛普森被控杀人案引起了世界的一片哗然(见表2)。
表2 辛普森(OJSimpson)案件部分物证检验结果(PCR法)[16]
基因座
第29号血痕
OJSimpson
Simpson前妻
RGoldman
(嫌疑人)
, 百拇医药 (被害人)
(被害人)
DQa
1.1,1.2,4
1.1,1.2
1.1,1.1
1.3,4
LDLR
A、B
A,B
A,B
A,B
GYPA
, http://www.100md.com
A,B
B,B
A,B
A,A
HBGG
A、B,C
B,C
A,B
A,A
D7S8
A,B
A,B
A,B
, 百拇医药
B,B
GC
A,B,C
B,C
A,C
A,A
对于表2,控方法医学鉴定人的解释是第29号血痕来源于Simpson和Goldman两人,之所以Goldman的DQa1.3未能从第29号血痕中检出是由于含量太少,因为29号血痕DQa4的区带也很弱。而辩方法医学鉴定人则认为既然第29号血痕没有检出DQa1.3,该血痕DQa4必然来自除表中3人外的第4个人。虽然在辛普森案件物证检材的检测中,没有使用STR基因座,但是该案例使人们对所有DNA检测能否作为证据在法庭上应用产生了怀疑。
正反两方面的例子,都使法医鉴定中STR的可靠性成了学术界争论的热点。下面就是争论的一些焦点问题。
, http://www.100md.com
4.1 如何控制DNA污染问题
STR的扩增效率极高,仅需要ng级甚至pg级的模板DNA,在这样微量的检材中由于操作过程中少量DNA的污染所造成的影响是不可估量的。沙皇遗骨检测中所采用的严格的限制条件为我们提供了很好的例证:将DNA提取和PCR扩增分别在两个实验室中完成;所有样本均采用一次性消毒塑料管;多点取样;并严格设立阳性和阴性对照。经过这些严格的控制,证明PCR污染基本不会影响实验结果的准确性和可靠性。
4.2 STR基因座的高突变率对结果分析的影响
群体遗传学的研究证实STR等位基因在群体中的分布符合孟德尔共显性遗传规律和Hardy-Weinberg平衡[17,18],可用于法医学的亲权鉴定。尽管如此,STR基因座的突变率明显高于人类基因的平均突变率这一事实是不容忽视的(STR基因座的突变率为10-2~10-5,人类基因的平均突变率为1.4×10-10)。由于目前法医鉴定中使用的三核苷酸、四核苷酸重复的突变率约在2.3×10-5~15.9×10-5之间,且一般都采用多基因座进行分析,因此对亲权鉴定不会产生显著的影响。不过,也有少数STR基因座的突变率是在法医学亲权鉴定时所不能接受的,如Moller在研究HUMMPBP-B基因座时发现在118次减数分裂中有两次突变,突变率为1.8%,远远超过了美国血库协会的“应用于亲权鉴定的DNA遗传标记突变率应小于0.2%”的标准。因此在考察一个基因座法医学应用价值时,应进行家系调查,了解该基因座生殖细胞的突变率,尽量选择低突变率的遗传标记。
, 百拇医药
4.3 如何准确分型
任何分析结果的准确性都有赖于数据读取的准确性。首先是人为因素。对于电泳分离后如何准确读取STR基因型,目前世界上采用两种策略,一是与人类等位基因分型标准物比对,另一种是通过回归方程计算。多国实验室间比较的结果显示,前者分型结果的可重复性是100%,而后一种的重现性较差。另一种影响数据读取准确性的因素是某些STR基因座在自身结构上存在微小异质性[6,19]。ISFH推荐使用重复数来命名STR的方法后,有人对法医学鉴定中常用的STR基因座进行了测序,结果发现造成“相同等位基因”之间电泳迁移率存在微小差异的原因是序列之间的差异,也就是说有的STR基因座并不是由核心序列简单重复而成。一种是由同一长度不同序列的多个核心序列重复而成的,如HUMVWA31(见表3);另一种是核心序列的非整倍重复,如HUMTH01的等位基因9.3(见表4),及综合这两种情况的更为复杂的多态性,如D21S11(见表5),因此从测序的结果看,以前通过电泳迁移率推测的“同一等位基因”可能由多个等位基因组成,只是由于受到检测手段的限制而没有被发现。这就相当于血清型和酶型中的亚型,在没有采用更精密的检测手段检出亚型时,虽然损失了一部分信息,降低了系统的识别能力,但并不影响该基因座作为法医学遗传标记的使用。STR系统在不考虑这些“亚型”时,已有很高的识别能力。了解了STR基因座的序列基础的复杂性后,我们应当特别重视等位基因分型标准物的使用,在电泳时间足够长的情况下分型,并特别注意象HUMTH019.3、D21S1130.2等位基因这样含非整倍核心序列的情况,以免错误分型。
, 百拇医药
表3 STR系统HUMVWA31基因座的重复序列结构
等位基因
片段长度
序列结构
13
134
TCTA(TCTG)4(TCTA)8
14
138
TCTA(TCTG)5(TCTA)3TCCA(TCTA)3
, 百拇医药
15
142
TCTA(TCTG)4(TCTA)10
15'
142
TCTA(TCTG)3(TCTA)11
16
146
TCTA(TCTG)4(TCTA)11
16'
, 百拇医药 146
TCTA(TCTG)3(TCTA)12
17
150
TCTA(TCTG)4(TCTA)12
18
154
TCTA(TCTG)4(TCTA)13
19
158
TCTA(TCTG)4(TCTA)14
, 百拇医药
20
162
TCTA(TCTG)4(TCTA)15
21
166
TCTA(TCTG)4(TCTA)16
22
170
TCTA(TCTG)4(TCTA)17
表4 STR系统HUMTH01基因座的重复序列结构
, http://www.100md.com
等位基因
片段长度
序列结构
5
154
(TCAT)5
6
158
(TCAT)6
7
162
(TCAT)7
, http://www.100md.com
8
166
(TCAT)8
9
170
(TCAT)9
93
173
(TCAT)4CAT(TCAT)5
10
174
(TCAT)10
, 百拇医药
11
178
(TCAT)11
表5 STR系统D21S11基因座重复序列结构
等位基因
片段长度
序列结构
26
209
(TCTA)4(TCTG)6……(TCTA)8
27
, 百拇医药
213
(TCTA)4(TCTG)6……(TCTA)9
28
217
(TCTA)4(TCTG)6……(TCTA)10
29
221
(TCTA)4(TCTG)6……(TCTA)11
29'
, 百拇医药
221
(TCTA)6(TCTG)5……(TCTA)10
30
225
(TCTA)6(TCTG)5……(TCTA)11
31'
229
(TCTA)6(TCTG)5……(TCTA)12
31
, http://www.100md.com
229
(TCTA)5(TCTG)6……(TCTA)12
32
233
(TCTA)6(TCTG)5……(TCTA)13
30.2
227
(TCTA)5(TCTG)6……(TCTA)10TATCTA
31.2
, 百拇医药
231
(TCTA)5(TCTG)6……(TCTA)11TATCTA
32.2
235
(TCTA)5(TCTG)6……(TCTA)12TATCTA
33.2
239
(TCTA)5(TCTG)6……(TCTA)13TATCTA
34.2
, 百拇医药
243
(TCTA)5(TCTG)6……(TCTA)14TATCTA
(TCTA)3TA(TCTA)3TCA(TCTA)2TCCATA
4.4 如何计算偶合率
在犯罪嫌疑人与犯罪现场检材基因型相同时,如何运用群体数据计算两个随机个体出现这种相同基因型的概率(即偶合率)。
对法医生物学检材进行个体识别,有三种可能的结果:(1)由于技术或检材本身的原因无检测结果;(2)犯罪嫌疑人与犯罪现场检材的基因型不符,被排除;(3)犯罪嫌疑人与犯罪现场检材的基因型相符,不能排除。在第三种情况时,需要运用群体数据计算由于机会造成犯罪嫌疑人与犯罪现场检材基因型相同的概率。目前所掌握的基因座,在不同群体的等位基因频率分布常常是有统计学差异的,因此用不同群体的数据计算得到的匹配概率是不完全相同的。
, 百拇医药
自从DNA分型技术应用于法医学领域,学术界就一直在争论如何正确运用群体数据计算。这个问题在多民族地区,特别是基因型频率在群体间差异显著的国家和地区尤为突出。美国学者在这方面提出了颇多见解。一些学者支持用犯罪嫌疑人所属的群体的数据计算,为了证明他们的观点,他们用犯罪嫌疑人所属的群体的数据及其它几个群体的数据计算,证明其个人识别机率是基本一致的[20]。还有一种观点是采用犯罪嫌疑人所属群体的该基因座基因型频率的2倍作为该基因型的频率来计算,与此类似的另一种观点是在所有已知群体数据中选择该基因座基因型频率最高的作为该基因型的频率来计算。这两种方法都是比较保守的,其出发点是最大限度的估计两个随机个体基因型相同的概率,最小限度估计系统的个人识别机率,用投入更多系统的策略,以期将错误认定犯罪嫌疑人的可能性减小到最小程度。其他学者对这两种论点的攻击之处是认为它们偏离了证据来源计算准确性的原则[21]。总之,虽然各种意见之间存在很大的分歧,但有利于被告者的原则是一般被接受了的。
4.5 无效等位基因(nullallele)对法医学鉴定的影响
, 百拇医药
少数作者在用PCR技术检测STR基因座的时候发现并不是所有在基因组中存在的等位基因都能被检测出来,那些不能被检测出的等位基因就被叫做无效等位基因。Callen在对6号染色体上23个STR基因座进行家系调查时发现有7个STR存在无效等位基因[22]。他认为这是由于引物结合区存在变异,使引物不能与模板特异性结合,因此在PCR扩增产物中缺乏相应的产物。如果某一STR基因座的引物结合区突变率较高,可重新设计引物,或选择其它更优化的遗传标记。
如前所述,在短短的几年时间里,由于STR具有高信息量,在基因组中广泛分布,以及可以用PCR扩增、电泳分型等优点,使其在生物学各领域得到广泛应用,并且取得了惊人的进展。在法医学应用中,由于STR系统的使用,使法医生物学检测进入了一个新的阶段,检测水平有了空前的提高,同时又面临着许多前所未有的问题。如何将STR这样一个高信息量的系统更有效地应用于法医学实践是广大法医工作者正致力探索的问题。
参考文献:
, http://www.100md.com
[1] Lee HC, Ladd C, Bourke MT,et al. DNA typing in forensic science :1.Theory and background[J].Am J Forensic Med and Path, 1994,15(4):269- 282.
[2] Shriver MD,Jin L,Chakraborty R.VNTR allele frequency distributions under the stepwise mutation model:acomputer simulation approatch[J].Genetics,1993,134:983- 993.
[3] Miesfield R,Krystal M,Arpheim N.A member of a new repeated sequence family which is conserved throughout eukaryotic evolution is found between the human d and B blobin genes[J]. Nucleic Acids Res, 1981,12:4127- 4138.
, http://www.100md.com
[4] Edwards Al,Civitello A,Hammond HA,et al.DNA typing and genetic mapping with trimeric and tetrameric tandem repeats[J]. Am J Hum Genet,1991,49:746- 756.
[5] Alford RL,Hammond HA,Coto I. Rapid and efficient resolution of parentage by amplification of short tandem repeats[J].Am J Hum Genet,1994,55:190- 195.
[6] Hammond H A, LI Jin, Zhong Y. Evaluation of 13 short tandem repeat loci for use in personal identification applications[J].Am J Hum Genet,1994,55:175- 189.
, 百拇医药
[7] DNA recommendations- 1994 report concerning further recommendations of the DNA commission of the ISFH regarding PCR- based polymorphisms in STR(short tandem repeat) systems[J]. Int J Leg Med, 1994,107:159- 160.
[8] Urquhart A, Kimpton CP, Downes TJ. Variation in short tandem repeats sequences- a survey of twelve microsatellite loci for use as forensic identification markers[J].Int J Leg Med,1994,107:13- 20.
[9] Bar w,Brinkmann B,Budowle B,et al.DNA recommendations: Further report of the DNA Commossion of the ISFH regarding the use of short tandem repeat systems[J].Int J Lega Med,1997,110:175- 176.
, 百拇医药
[10] Dib C,Faure S,Fizames C.A comprehensive genetic map of the human genome based on 5,264 microsatellites[J].Nature,1996,380:152- 154.
11] Koreth J,O′ Leary JJ,Mcgee J O′ D. Microsatellite and PCR genomic analysis[J]. J Path, 1996,178:239- 248.
[12] Gill P, Ivanov PL, Kimpton C. Identification of the remains of the Romanov family by DNA analysis[J].Nat Genet, 1994,6:130- 135.
[13] Roy MS, Girman DJ, Taylor AC. The use of museum specimens to reconstruct the genetic variability and relationships of extinct populations[J].Experientia,1994,50(6):551- 557.
, http://www.100md.com
[14] Poinar GO Jr. The range of life in amber: singificance and implications in DNA studies[J]. Experientia, 1994,50(6):536- 42.
[15] Tuross N.The biochemistry of ancient DNA in bone[J]. Experientia, 1994,50(6):530- 5.
[16] Weir BS.DNA statistics in the Simpson matter[J].Nat Genet, 1995,11:365- 368.
[17] Hou Y,Mulcahy- Schroeder M,Mielke M,et al.Genetic variation at the short tandem repeat loci HUMTH01 and HUMVWA within and between Chinese and German populations[J].Medizinische Genetik, 1996,8(1):101.
, http://www.100md.com
[18] Hou Y,Walter H.Genetic substructure at the STR loci HUMTH01 and HUMVWA in Han populations, China[A]. Carracedo A, Brinkmann B, Baer W. Advance in Forensic Haemogenetics 6[M].Springer- Verlag:Berlin Heidelberg New York,1996:468- 470.
[19] Moller A, Meyer E, Brinkmann B. Different types of structural variation in STR: HumFES/FPS,HumVWA and D21S11[J].Int J Leg Med,1994,106:319- 323.
[20] Chakraborty R,Kidd KK.The utility of DNA typing in forensic work[J].Science,1991,254:1735- 1739.
[21] Morton NE.DNA in court[J].Eur J Hum Genet.1993,1:172- 178.
[22] Callen DF. Incidence and origin of "null" allele in the (AC)n microsatellites markers[J].Am J Hum Genet,1993,2:922- 30.
(收稿日期:1998-07-31), 百拇医药
单位:华西医科大学法医学院,四川成都 610041
关键词:
法医学杂志000136
[中图分类号]DF795.2 [文献标识码]A
[文章编号]1004-5619(2000)01-0055-04
1 STR的概念
短串联重复序列(short tandem repeat,简称STR),也叫微卫星DNA(microsatellite),或简单重复序列(simple sequence repeat,简称SSR),是一类广泛存在于真核生物基因组中的DNA串联重复序列。其核心序列为2~6bp[1],重复次数通常在15~30次。少数学者倾向于称核心序列2bp的为微卫星DNA,3~5bp的为STR[2],本文以前一种认识为基础。DNA重复序列家族成员之间的关系见表1。
, 百拇医药
表1 DNA重复序列家族成员特点比较
卫星DNA
(satellite)
小卫星DNA
(minisatellite)
微卫星DNA
(microsatellite)
核心序列长度
5~100bp
15~70bp
2~6bp
片段长度
, 百拇医药
<100Mb
0.5~30Kb
约200bp
是否具有长度多态性
多数没有
多数具有多态性
多数具有多态性
分布
位于染色体着丝粒、端粒附近的异染色质区
位于近染色体着丝粒和端粒区
位于常染色质区
最早发现STR是由于在真核生物基因组中发现了由dT-dG串联重复组成的长度可变序列[3]。以后的研究表明,STR在基因组中广泛分布,其中以dA-dC,dA-dA-dN,dC-dA和dA-dG为核心序列的STR在基因组中分布最为广泛,如(dC-dA)n在人类基因组中就有35000到100000个,以最保守的估计,每100Kb就有一个(dC-dA)n基因座。多数的STR基因座具有多态性[4],其高度多态性主要源于核心序列重复次数的个体间差异,这种差异在基因传递的过程中一般遵循孟德尔共显性遗传规律[5]。STR作为一个重要的遗传标记系统,已广泛应用于肿瘤生化研究、法医学个体识别、亲权鉴定和群体遗传学分析等领域。
, http://www.100md.com
2 STR的命名
STR的多态性一般是指由于核心序列重复次数不同而构成的长度多态性,但测序研究结果证明STR也存在着序列多态性。在实际应用中序列多态性的检测手段繁琐,对仪器、设备要求高,较少采用,而长度多态性检测已被广泛应用于法医学个人识别[6]和亲权鉴定[5]。
国际法医学者研究STR始于1993年,当年在意大利威尼斯召开的第15届国际法医血液遗传学DNA鉴定委员会(the DNA commission of the international society of forensic haemogenetics,简称ISFH)国际会议上[7],一些作者报道了这方面的研究成果,该学会DNA委员会提出了基于短串联重复序列的法医DNA分型推荐方案,建议用核心序列重复数命名STR的等位基因,用小数点后的数表示不完整核心序列的bp数,如HUMTH01[8]的等位基因9.3就是在(TCAT)n的重复序列中包含了CAT这样一个3bp的不完整的核心序列。但是,由于各作者在报道STR基因座时可使用两条互补链中的任意一条,而且可定义不同的核心序列,因此在STR命名上仍然存在一定程度的混乱。如
, 百拇医药
1.5'-GGTCATCATCATGG-3'3×TCA
2.5'-GGTCATCATCATGG-3'3×CAT
在以上的例子中,由于阅读重复序列的起始点不同,使对同一序列的核心序列的认识发生了分歧。针对这些问题ISFH于1997年再次召开国际会议讨论STR基因座的命名。会议通过DNA的序列从5'到3'方向阅读,编码蛋白质的基因内STR以蛋白质编码链为准;与蛋白质编码基因无关的STR基因座以最初公开发表的资料使用的链为依据命名。对于以上提到的由于阅读重复序列的起始点不同,使对同一重复序列的核心序列命名不同,ISFH建议以5'端第一个包含在重复序列中的核苷酸命名STR基因座[9]。
3 STR的优点
PCR扩增STR基因座仅需少量模板DNA,灵敏度比传统的DNA指纹高得多。另外STR扩增片段长度较短,对于法医常遇到的仅含降解DNA的陈旧性斑痕,STR的扩增效率比传统的DNA指纹更高。因此,STR分型被认为是第二代法医DNA指纹技术的核心,是目前国内外法医学个体识别和亲权鉴定的主要技术发展方向。下面就分述STR在法医学鉴定中的一些优点。
, 百拇医药
3.1 STR基因座的个体识别机率及非父排除率高
STR在人类基因组中广泛分布,与传统的蛋白质遗传标记相比,等位基因多,杂合度高,因此多个STR基因座联合检测时,个体识别机率和非父排除率很高。从1904年第一例应用生物性检材进行个人识别的案例被报道以来,大量的红细胞抗原、同工酶标记、血清蛋白标记以及人类白细胞抗原(human leukocyte antigens,简称HLA)蛋白已被用于法医实践中。和这些基因表达产物相比,DNA在检材中更稳定,可保留更长的时间,因此更适用于法医学鉴定。STR检测和以往的DNA水平的检测相比,由于它在人类基因组中分布极为广泛,且片段小,等位基因多,杂合度高,如在Did等人研究的5264个STR基因座中93%的杂合度大于0.5,58%的杂合度大于0.7,平均杂合度为0.7[10]。因此不同个体基因型不同的可能性更大,随机个体与罪犯之间由于机会造成的基因型相同的可能性大大减小。如有报道显示,两个无关个体在14个STR基因座基因型完全相同的可能性仅为1×10-14[11],即理论上说,在目前地球上60亿人口中没有任何两个无关个体在这14个STR基因座基因型完全相同。
, http://www.100md.com
3.2 适用于各种来源的生物性检材,检测灵敏度和成功率高
由于STR的片段长度较短,一般在100~300bp,又很容易通过PCR扩增、电泳分型,因此比绝大多数其它遗传标记系统更适用于高度降解检材的检测;其中三核苷酸、四核苷酸重复PCR扩增结果更稳定,产生的附加带、影子带少,容易分型,所以在法医学中得到了最为广泛的应用[4]。本实验室在用STR基因座检测血痕、唾液斑、精液斑、人体组织等进行个体同一认定、亲权鉴定时都取得了成功。更为令人振奋的是,在末代沙皇一家遗骨的鉴定中,英国内务部成功地利用5个STR基因座对挖掘出来的75年以前的尸骨进行了检测,在DNA含量仅有50pg或更少的情况下,认定了9付骨骼的性别及亲属关系[12],正是由于他们对如此古老(高度降解)微量检材的检测取得令人满意的结果,引起了国际社会的普遍关注,使人们对STR在法医学鉴定中的应用充满信心。美国对博物馆中动物标本及琥珀等样本所进行的STR分析[13-15],更证实了它在法医学鉴定及人类学研究中强大的鉴别能力。
, 百拇医药
4 STR的缺点
正当各国法医工作者竞相将STR检测应用于司法实践中时,1994~1995年在美国洛杉矶审判的,被媒体称为“世纪审判”的辛普森被控杀人案引起了世界的一片哗然(见表2)。
表2 辛普森(OJSimpson)案件部分物证检验结果(PCR法)[16]
基因座
第29号血痕
OJSimpson
Simpson前妻
RGoldman
(嫌疑人)
, 百拇医药 (被害人)
(被害人)
DQa
1.1,1.2,4
1.1,1.2
1.1,1.1
1.3,4
LDLR
A、B
A,B
A,B
A,B
GYPA
, http://www.100md.com
A,B
B,B
A,B
A,A
HBGG
A、B,C
B,C
A,B
A,A
D7S8
A,B
A,B
A,B
, 百拇医药
B,B
GC
A,B,C
B,C
A,C
A,A
对于表2,控方法医学鉴定人的解释是第29号血痕来源于Simpson和Goldman两人,之所以Goldman的DQa1.3未能从第29号血痕中检出是由于含量太少,因为29号血痕DQa4的区带也很弱。而辩方法医学鉴定人则认为既然第29号血痕没有检出DQa1.3,该血痕DQa4必然来自除表中3人外的第4个人。虽然在辛普森案件物证检材的检测中,没有使用STR基因座,但是该案例使人们对所有DNA检测能否作为证据在法庭上应用产生了怀疑。
正反两方面的例子,都使法医鉴定中STR的可靠性成了学术界争论的热点。下面就是争论的一些焦点问题。
, http://www.100md.com
4.1 如何控制DNA污染问题
STR的扩增效率极高,仅需要ng级甚至pg级的模板DNA,在这样微量的检材中由于操作过程中少量DNA的污染所造成的影响是不可估量的。沙皇遗骨检测中所采用的严格的限制条件为我们提供了很好的例证:将DNA提取和PCR扩增分别在两个实验室中完成;所有样本均采用一次性消毒塑料管;多点取样;并严格设立阳性和阴性对照。经过这些严格的控制,证明PCR污染基本不会影响实验结果的准确性和可靠性。
4.2 STR基因座的高突变率对结果分析的影响
群体遗传学的研究证实STR等位基因在群体中的分布符合孟德尔共显性遗传规律和Hardy-Weinberg平衡[17,18],可用于法医学的亲权鉴定。尽管如此,STR基因座的突变率明显高于人类基因的平均突变率这一事实是不容忽视的(STR基因座的突变率为10-2~10-5,人类基因的平均突变率为1.4×10-10)。由于目前法医鉴定中使用的三核苷酸、四核苷酸重复的突变率约在2.3×10-5~15.9×10-5之间,且一般都采用多基因座进行分析,因此对亲权鉴定不会产生显著的影响。不过,也有少数STR基因座的突变率是在法医学亲权鉴定时所不能接受的,如Moller在研究HUMMPBP-B基因座时发现在118次减数分裂中有两次突变,突变率为1.8%,远远超过了美国血库协会的“应用于亲权鉴定的DNA遗传标记突变率应小于0.2%”的标准。因此在考察一个基因座法医学应用价值时,应进行家系调查,了解该基因座生殖细胞的突变率,尽量选择低突变率的遗传标记。
, 百拇医药
4.3 如何准确分型
任何分析结果的准确性都有赖于数据读取的准确性。首先是人为因素。对于电泳分离后如何准确读取STR基因型,目前世界上采用两种策略,一是与人类等位基因分型标准物比对,另一种是通过回归方程计算。多国实验室间比较的结果显示,前者分型结果的可重复性是100%,而后一种的重现性较差。另一种影响数据读取准确性的因素是某些STR基因座在自身结构上存在微小异质性[6,19]。ISFH推荐使用重复数来命名STR的方法后,有人对法医学鉴定中常用的STR基因座进行了测序,结果发现造成“相同等位基因”之间电泳迁移率存在微小差异的原因是序列之间的差异,也就是说有的STR基因座并不是由核心序列简单重复而成。一种是由同一长度不同序列的多个核心序列重复而成的,如HUMVWA31(见表3);另一种是核心序列的非整倍重复,如HUMTH01的等位基因9.3(见表4),及综合这两种情况的更为复杂的多态性,如D21S11(见表5),因此从测序的结果看,以前通过电泳迁移率推测的“同一等位基因”可能由多个等位基因组成,只是由于受到检测手段的限制而没有被发现。这就相当于血清型和酶型中的亚型,在没有采用更精密的检测手段检出亚型时,虽然损失了一部分信息,降低了系统的识别能力,但并不影响该基因座作为法医学遗传标记的使用。STR系统在不考虑这些“亚型”时,已有很高的识别能力。了解了STR基因座的序列基础的复杂性后,我们应当特别重视等位基因分型标准物的使用,在电泳时间足够长的情况下分型,并特别注意象HUMTH019.3、D21S1130.2等位基因这样含非整倍核心序列的情况,以免错误分型。
, 百拇医药
表3 STR系统HUMVWA31基因座的重复序列结构
等位基因
片段长度
序列结构
13
134
TCTA(TCTG)4(TCTA)8
14
138
TCTA(TCTG)5(TCTA)3TCCA(TCTA)3
, 百拇医药
15
142
TCTA(TCTG)4(TCTA)10
15'
142
TCTA(TCTG)3(TCTA)11
16
146
TCTA(TCTG)4(TCTA)11
16'
, 百拇医药 146
TCTA(TCTG)3(TCTA)12
17
150
TCTA(TCTG)4(TCTA)12
18
154
TCTA(TCTG)4(TCTA)13
19
158
TCTA(TCTG)4(TCTA)14
, 百拇医药
20
162
TCTA(TCTG)4(TCTA)15
21
166
TCTA(TCTG)4(TCTA)16
22
170
TCTA(TCTG)4(TCTA)17
表4 STR系统HUMTH01基因座的重复序列结构
, http://www.100md.com
等位基因
片段长度
序列结构
5
154
(TCAT)5
6
158
(TCAT)6
7
162
(TCAT)7
, http://www.100md.com
8
166
(TCAT)8
9
170
(TCAT)9
93
173
(TCAT)4CAT(TCAT)5
10
174
(TCAT)10
, 百拇医药
11
178
(TCAT)11
表5 STR系统D21S11基因座重复序列结构
等位基因
片段长度
序列结构
26
209
(TCTA)4(TCTG)6……(TCTA)8
27
, 百拇医药
213
(TCTA)4(TCTG)6……(TCTA)9
28
217
(TCTA)4(TCTG)6……(TCTA)10
29
221
(TCTA)4(TCTG)6……(TCTA)11
29'
, 百拇医药
221
(TCTA)6(TCTG)5……(TCTA)10
30
225
(TCTA)6(TCTG)5……(TCTA)11
31'
229
(TCTA)6(TCTG)5……(TCTA)12
31
, http://www.100md.com
229
(TCTA)5(TCTG)6……(TCTA)12
32
233
(TCTA)6(TCTG)5……(TCTA)13
30.2
227
(TCTA)5(TCTG)6……(TCTA)10TATCTA
31.2
, 百拇医药
231
(TCTA)5(TCTG)6……(TCTA)11TATCTA
32.2
235
(TCTA)5(TCTG)6……(TCTA)12TATCTA
33.2
239
(TCTA)5(TCTG)6……(TCTA)13TATCTA
34.2
, 百拇医药
243
(TCTA)5(TCTG)6……(TCTA)14TATCTA
(TCTA)3TA(TCTA)3TCA(TCTA)2TCCATA
4.4 如何计算偶合率
在犯罪嫌疑人与犯罪现场检材基因型相同时,如何运用群体数据计算两个随机个体出现这种相同基因型的概率(即偶合率)。
对法医生物学检材进行个体识别,有三种可能的结果:(1)由于技术或检材本身的原因无检测结果;(2)犯罪嫌疑人与犯罪现场检材的基因型不符,被排除;(3)犯罪嫌疑人与犯罪现场检材的基因型相符,不能排除。在第三种情况时,需要运用群体数据计算由于机会造成犯罪嫌疑人与犯罪现场检材基因型相同的概率。目前所掌握的基因座,在不同群体的等位基因频率分布常常是有统计学差异的,因此用不同群体的数据计算得到的匹配概率是不完全相同的。
, 百拇医药
自从DNA分型技术应用于法医学领域,学术界就一直在争论如何正确运用群体数据计算。这个问题在多民族地区,特别是基因型频率在群体间差异显著的国家和地区尤为突出。美国学者在这方面提出了颇多见解。一些学者支持用犯罪嫌疑人所属的群体的数据计算,为了证明他们的观点,他们用犯罪嫌疑人所属的群体的数据及其它几个群体的数据计算,证明其个人识别机率是基本一致的[20]。还有一种观点是采用犯罪嫌疑人所属群体的该基因座基因型频率的2倍作为该基因型的频率来计算,与此类似的另一种观点是在所有已知群体数据中选择该基因座基因型频率最高的作为该基因型的频率来计算。这两种方法都是比较保守的,其出发点是最大限度的估计两个随机个体基因型相同的概率,最小限度估计系统的个人识别机率,用投入更多系统的策略,以期将错误认定犯罪嫌疑人的可能性减小到最小程度。其他学者对这两种论点的攻击之处是认为它们偏离了证据来源计算准确性的原则[21]。总之,虽然各种意见之间存在很大的分歧,但有利于被告者的原则是一般被接受了的。
4.5 无效等位基因(nullallele)对法医学鉴定的影响
, 百拇医药
少数作者在用PCR技术检测STR基因座的时候发现并不是所有在基因组中存在的等位基因都能被检测出来,那些不能被检测出的等位基因就被叫做无效等位基因。Callen在对6号染色体上23个STR基因座进行家系调查时发现有7个STR存在无效等位基因[22]。他认为这是由于引物结合区存在变异,使引物不能与模板特异性结合,因此在PCR扩增产物中缺乏相应的产物。如果某一STR基因座的引物结合区突变率较高,可重新设计引物,或选择其它更优化的遗传标记。
如前所述,在短短的几年时间里,由于STR具有高信息量,在基因组中广泛分布,以及可以用PCR扩增、电泳分型等优点,使其在生物学各领域得到广泛应用,并且取得了惊人的进展。在法医学应用中,由于STR系统的使用,使法医生物学检测进入了一个新的阶段,检测水平有了空前的提高,同时又面临着许多前所未有的问题。如何将STR这样一个高信息量的系统更有效地应用于法医学实践是广大法医工作者正致力探索的问题。
参考文献:
, http://www.100md.com
[1] Lee HC, Ladd C, Bourke MT,et al. DNA typing in forensic science :1.Theory and background[J].Am J Forensic Med and Path, 1994,15(4):269- 282.
[2] Shriver MD,Jin L,Chakraborty R.VNTR allele frequency distributions under the stepwise mutation model:acomputer simulation approatch[J].Genetics,1993,134:983- 993.
[3] Miesfield R,Krystal M,Arpheim N.A member of a new repeated sequence family which is conserved throughout eukaryotic evolution is found between the human d and B blobin genes[J]. Nucleic Acids Res, 1981,12:4127- 4138.
, http://www.100md.com
[4] Edwards Al,Civitello A,Hammond HA,et al.DNA typing and genetic mapping with trimeric and tetrameric tandem repeats[J]. Am J Hum Genet,1991,49:746- 756.
[5] Alford RL,Hammond HA,Coto I. Rapid and efficient resolution of parentage by amplification of short tandem repeats[J].Am J Hum Genet,1994,55:190- 195.
[6] Hammond H A, LI Jin, Zhong Y. Evaluation of 13 short tandem repeat loci for use in personal identification applications[J].Am J Hum Genet,1994,55:175- 189.
, 百拇医药
[7] DNA recommendations- 1994 report concerning further recommendations of the DNA commission of the ISFH regarding PCR- based polymorphisms in STR(short tandem repeat) systems[J]. Int J Leg Med, 1994,107:159- 160.
[8] Urquhart A, Kimpton CP, Downes TJ. Variation in short tandem repeats sequences- a survey of twelve microsatellite loci for use as forensic identification markers[J].Int J Leg Med,1994,107:13- 20.
[9] Bar w,Brinkmann B,Budowle B,et al.DNA recommendations: Further report of the DNA Commossion of the ISFH regarding the use of short tandem repeat systems[J].Int J Lega Med,1997,110:175- 176.
, 百拇医药
[10] Dib C,Faure S,Fizames C.A comprehensive genetic map of the human genome based on 5,264 microsatellites[J].Nature,1996,380:152- 154.
11] Koreth J,O′ Leary JJ,Mcgee J O′ D. Microsatellite and PCR genomic analysis[J]. J Path, 1996,178:239- 248.
[12] Gill P, Ivanov PL, Kimpton C. Identification of the remains of the Romanov family by DNA analysis[J].Nat Genet, 1994,6:130- 135.
[13] Roy MS, Girman DJ, Taylor AC. The use of museum specimens to reconstruct the genetic variability and relationships of extinct populations[J].Experientia,1994,50(6):551- 557.
, http://www.100md.com
[14] Poinar GO Jr. The range of life in amber: singificance and implications in DNA studies[J]. Experientia, 1994,50(6):536- 42.
[15] Tuross N.The biochemistry of ancient DNA in bone[J]. Experientia, 1994,50(6):530- 5.
[16] Weir BS.DNA statistics in the Simpson matter[J].Nat Genet, 1995,11:365- 368.
[17] Hou Y,Mulcahy- Schroeder M,Mielke M,et al.Genetic variation at the short tandem repeat loci HUMTH01 and HUMVWA within and between Chinese and German populations[J].Medizinische Genetik, 1996,8(1):101.
, http://www.100md.com
[18] Hou Y,Walter H.Genetic substructure at the STR loci HUMTH01 and HUMVWA in Han populations, China[A]. Carracedo A, Brinkmann B, Baer W. Advance in Forensic Haemogenetics 6[M].Springer- Verlag:Berlin Heidelberg New York,1996:468- 470.
[19] Moller A, Meyer E, Brinkmann B. Different types of structural variation in STR: HumFES/FPS,HumVWA and D21S11[J].Int J Leg Med,1994,106:319- 323.
[20] Chakraborty R,Kidd KK.The utility of DNA typing in forensic work[J].Science,1991,254:1735- 1739.
[21] Morton NE.DNA in court[J].Eur J Hum Genet.1993,1:172- 178.
[22] Callen DF. Incidence and origin of "null" allele in the (AC)n microsatellites markers[J].Am J Hum Genet,1993,2:922- 30.
(收稿日期:1998-07-31), 百拇医药