中文医学文献主题标引中常见错误浅析
作者:梅芹
单位:苏州医学院图书馆,苏州,215007
关键词:医学文献;文献检索;主题标引;质量分析
苏州医学院学报990930 摘要 本文举例说明了在日常文献检索工作中发现的错误标引问题,对主题标引错误的原因进行分析讨论,并根据具体情况提出了几点建议。
中图法分类 G254
文献标引包括分类、主题词、副主题词及特征词等标引,最常用的为主题词标引。主题检索途径为文献检索的主要途径,因此主题标引的准确程度或者主题标引的质量,可直接影响文献检索的效果和质量。若主题标引错误,将出现误检、漏检等现象。由于医学科学发展迅速,词表的新增、替代频繁,给医学主题词的标引带来不便,标引工作中容易出现不恰当的甚至错误的标引。本文根据日常检索时所发现的问题,对中文医学文献检索中主题标引的常见错误分析讨论如下。
, http://www.100md.com
1 主题标引中常出现的错误
1.1 主题分析不当:是指提炼出来的主题词概念与文献所论述的主题概念之间的人为差异。
1.1.1 主题概念提炼错误:即与文献中论述的主题概念不符。如“甲硝唑注射液的细菌内毒素试验考察”一文,标引为“甲硝唑/药理学/注射剂”,而注射剂的细菌内毒素试验是属于热原测定,非药理学范畴,主题分析错误而导致错标。
1.1.2 主题概念提炼过多:即提炼的主题概念超出文献论述的主题概念。标引人员误认为提炼出来的主题概念越多,提供的检索途径就越多,能有效地提高用户检索效率。但实际上,过多地将没有参考价值或者虽有参考价值,但不符合检索系统要求的主题概念提炼出来,不但不能提高检索效率和效果,甚至出现检索系统混乱。如“大剂量醛氢叶酸、5-Fu、DDP联合治疗晚期鼻咽癌的初步报告”一文,由于未理解两个主题的含义,重复标引了“抗肿瘤药,多剂联用”和“药物疗法,联合”。
, 百拇医药
1.1.3 主题概念提炼过少:即提炼的主题概念少于文献论述的主题概念。若不认真分析理解文献的内容或只从文献题名入手,过于精炼,标引尺度没有把握好就易导致漏标。如“DNA重组技术”一文,CBM只标引“DNA,重组”一个主题词,这个主题词是从题名字面上理解所得,并未对原始文献进行综合分析。实际上,这篇文献涉及到生物技术、遗传工程等多方面内容,除了“DNA,重组”一词作为主题词进行标引外,还需选取“生物技术方法”、“遗传工程”、“蛋白质工程”等主题词进行标引,避免漏检。再如“精神分裂症患者外周血T淋巴细胞亚群异常的探讨”一文,也只标引了“精神分裂症/免疫学”一个主题词,遗漏了较重要的主题词“T淋巴细胞亚群”。
1.2 主题词选择不当
1.2.1 违反专指性原则:所选用的主题词与文献主题内容所表达概念相符合程度称为专指度,是专指性的具体体现。如不熟悉词表及其收词范围,或对某些主题词的含义理解不当,就会违反标引的专指性原则。如“杆菌性血管瘤病”一文,数据库中标引为“血管瘤病/微生物学”,但主题词表中有专用主题词“血管瘤病,杆菌性”,应用后者来标引比较恰当。
, http://www.100md.com
再如“腮腺炎疫苗的现状”一文,CBM中采用了“腮腺炎”和“疫苗”两个主题词来标引,但这里应用“腮腺炎疫苗”这一专用主题词标引较合适。
1.2.2 违反一致性原则:由于主题标引工作的人为性很强,加上主题词表中存在部分近义词,常使文献的主题标引出现前后选词不一致的现象。美国的伦德兹(P.Lunds)对标引的一致性做过两项试验:若以标引完全一致率为“1”计,同一时间对同一文献由6人标引改为两人标引,前者一致率为0.158,后者为0.543;同一文献由同一人在不同时间标引,一致率为0.661。结果表明,标引人员相对固定,人员素质不断提高,对减少标引差异具有重要意义。
1.3 主题词之间的组配以及主题词与副主题词组配标引时易出现的错误
实际标引工作中会遇到许多没有收入词表的复合概念或短语,需经综合分析,用已有的主题词进行组配,来表达文献的主题内容。在日常检索工作中,常发现主题词和副主题词组配类型不一致、组配范围不恰当及副主题词标引不到位等错误。如“抗凝疗法治疗晚期狼疮性肾炎的护理”一文,CBM中用“狼疮/护理”和“肾炎/护理”两个主题词标引,未采用先组式主题词“狼疮肾炎/护理”来标引。
, 百拇医药
再如,“自制OLYMPUS胃镜送水系统”一文,CBM中仅标引“胃镜检查”一个主题词,实际上原文讨论的“胃镜送水系统”是属于仪器、设备类的内容,要加副主题词“仪器与设备”限定,即“胃镜检查/仪器与设备”才符合原文含义。
1.4 中医中药学主题标引不足:主要体现在一些穴位疗法或针炙疗法时,穴位名称未加标引;或中医药疗法中的中药方剂名称或主要成份未能标出。对检索者来说,仅从疾病与副主题词“中医药疗法”、“穴位疗法”、“针炙疗法”组配查找,范围太大,增加了检索“躁声”。如“中药灌肠治疗婴幼儿腹泻224例临床观察”一文,仅标引“腹泻,婴儿/中医药疗法,灌肠”。再如“药物穴位埋藏治疗癫痫的临床研究”,仅标引“癫痫/穴位疗法”,而中药是什么、穴位埋藏的药物成份是什么都未标明,给检索者判读命中文献造成困难。
2 主题标引错误的主要原因
2.1 标引人员人为因素:由于标引人员受医学知识水平、理解问题的角度、对词表熟悉程度等限制,在实际进行主题分析、主题词选择、转换及组配副主题词时,不能客观反映作者的意图、文献所论述的事物或研究对象,造成错误标引。有些文献标引甚至违反了叙词语言的基本特征——概念组配,而造成字面组配。这是最主要的原因。
, http://www.100md.com
2.2 标引工具因素:《英汉对照医学主题词注释字顺表》的更新速度太慢,跟不上医学科学发展的节奏,目前使用的是根据1992年的《MeSH》编制的,有许多新的专业名词术语尚未收入,也未见有补充本。再者,该表对中医学主题词收录较少。《中医药主题词表》虽有中医药学主题词,但有些主题词和副主题词范围太大,作为主题词标引后显得太粗,标引深度不足。因此,建立健全统一使用的、比较合理的、能及时更新的专业主题词表,很有必要,对提高主题标引质量有积极作用。
3 建议
3.1 提高标引人员的素质:主题分析误差多由标引人员的医学专业知识、综合分析能力等因素造成,所以标引人员应不断加强自身专业知识的学习,提高标引技能,尤其要紧跟医学科学发展,准确理解医学领域的新概念、新理论,从而在实路中总结经验,提高标引工作质量,为用户提供一个高质量的主题检索系统。
3.2 减少主题标引的不一致性:首先,必须对标引工作进行全面、有效的控制,也就是要制定出一套完整的标引准则,使标引工作规范化,以保持其一致性;其次,由于各人对文献主题内容的理解角度及能力不同,对文献主题的分析结果也不尽相同,相对稳定标引人员队伍,可减少主题分析和主题标引的不一致性。
, http://www.100md.com
3.3 控制主题标引深度:从信息角度看,标引深度大,检索标识数量多,文献检索途径也多,用户检索到文献的机率就大,但也不能认为标引深度越大越好,在一定条件下,标引深度越大,查全率越高,而查准率却下降,标引误差和检索误差也会增大。标引深度过浅可能会漏掉一些有价值的检索信息而导致漏检。在实际标引中,原则上是适度标引,在保证查准率的前提下,提高查全率,对标引深度给予必要限制。
3.4 加强标引工具的系统性建设:切实加强标引工具的系统性建设,建立健全统一的、合理的、能及时更新的专业主题词表,为标引工作提供前期保证,对提高主题标引质量有积极作用。
参考文献
1 黎雯.文献主题标引质量分析.江苏图书馆学报,1998,(6)∶17~20
2 傅群.论期刊文献的主题标引.江苏图书馆学报,1998,(6)∶21~22
, http://www.100md.com
3 关淡庄,等.将CBMDISC作为现代化的医学主题词标引工具.医学情报工作,1996,17(4)∶35~38
4 孙欣,祝可珍.文献主题标引误差小议.图书馆建设,1997,(5)∶74
5 王红松,唐芬.科技期刊论文的主题标引.图书情报工作,1997,(2)∶42~44
6 冯艳娟.主题标引和主题检索的关系剖析.医学图书馆通讯,1997,(4)∶38~39
7 任淑敏,李健.医学文献检索中常用组配标引模式和规律.医学图书馆通讯,1997,(2)∶42
8 马绪超.文献主题标引中的组配问题.图书情报工作,1998,(8)∶29~32
(1999年3月10日收稿), 百拇医药
单位:苏州医学院图书馆,苏州,215007
关键词:医学文献;文献检索;主题标引;质量分析
苏州医学院学报990930 摘要 本文举例说明了在日常文献检索工作中发现的错误标引问题,对主题标引错误的原因进行分析讨论,并根据具体情况提出了几点建议。
中图法分类 G254
文献标引包括分类、主题词、副主题词及特征词等标引,最常用的为主题词标引。主题检索途径为文献检索的主要途径,因此主题标引的准确程度或者主题标引的质量,可直接影响文献检索的效果和质量。若主题标引错误,将出现误检、漏检等现象。由于医学科学发展迅速,词表的新增、替代频繁,给医学主题词的标引带来不便,标引工作中容易出现不恰当的甚至错误的标引。本文根据日常检索时所发现的问题,对中文医学文献检索中主题标引的常见错误分析讨论如下。
, http://www.100md.com
1 主题标引中常出现的错误
1.1 主题分析不当:是指提炼出来的主题词概念与文献所论述的主题概念之间的人为差异。
1.1.1 主题概念提炼错误:即与文献中论述的主题概念不符。如“甲硝唑注射液的细菌内毒素试验考察”一文,标引为“甲硝唑/药理学/注射剂”,而注射剂的细菌内毒素试验是属于热原测定,非药理学范畴,主题分析错误而导致错标。
1.1.2 主题概念提炼过多:即提炼的主题概念超出文献论述的主题概念。标引人员误认为提炼出来的主题概念越多,提供的检索途径就越多,能有效地提高用户检索效率。但实际上,过多地将没有参考价值或者虽有参考价值,但不符合检索系统要求的主题概念提炼出来,不但不能提高检索效率和效果,甚至出现检索系统混乱。如“大剂量醛氢叶酸、5-Fu、DDP联合治疗晚期鼻咽癌的初步报告”一文,由于未理解两个主题的含义,重复标引了“抗肿瘤药,多剂联用”和“药物疗法,联合”。
, 百拇医药
1.1.3 主题概念提炼过少:即提炼的主题概念少于文献论述的主题概念。若不认真分析理解文献的内容或只从文献题名入手,过于精炼,标引尺度没有把握好就易导致漏标。如“DNA重组技术”一文,CBM只标引“DNA,重组”一个主题词,这个主题词是从题名字面上理解所得,并未对原始文献进行综合分析。实际上,这篇文献涉及到生物技术、遗传工程等多方面内容,除了“DNA,重组”一词作为主题词进行标引外,还需选取“生物技术方法”、“遗传工程”、“蛋白质工程”等主题词进行标引,避免漏检。再如“精神分裂症患者外周血T淋巴细胞亚群异常的探讨”一文,也只标引了“精神分裂症/免疫学”一个主题词,遗漏了较重要的主题词“T淋巴细胞亚群”。
1.2 主题词选择不当
1.2.1 违反专指性原则:所选用的主题词与文献主题内容所表达概念相符合程度称为专指度,是专指性的具体体现。如不熟悉词表及其收词范围,或对某些主题词的含义理解不当,就会违反标引的专指性原则。如“杆菌性血管瘤病”一文,数据库中标引为“血管瘤病/微生物学”,但主题词表中有专用主题词“血管瘤病,杆菌性”,应用后者来标引比较恰当。
, http://www.100md.com
再如“腮腺炎疫苗的现状”一文,CBM中采用了“腮腺炎”和“疫苗”两个主题词来标引,但这里应用“腮腺炎疫苗”这一专用主题词标引较合适。
1.2.2 违反一致性原则:由于主题标引工作的人为性很强,加上主题词表中存在部分近义词,常使文献的主题标引出现前后选词不一致的现象。美国的伦德兹(P.Lunds)对标引的一致性做过两项试验:若以标引完全一致率为“1”计,同一时间对同一文献由6人标引改为两人标引,前者一致率为0.158,后者为0.543;同一文献由同一人在不同时间标引,一致率为0.661。结果表明,标引人员相对固定,人员素质不断提高,对减少标引差异具有重要意义。
1.3 主题词之间的组配以及主题词与副主题词组配标引时易出现的错误
实际标引工作中会遇到许多没有收入词表的复合概念或短语,需经综合分析,用已有的主题词进行组配,来表达文献的主题内容。在日常检索工作中,常发现主题词和副主题词组配类型不一致、组配范围不恰当及副主题词标引不到位等错误。如“抗凝疗法治疗晚期狼疮性肾炎的护理”一文,CBM中用“狼疮/护理”和“肾炎/护理”两个主题词标引,未采用先组式主题词“狼疮肾炎/护理”来标引。
, 百拇医药
再如,“自制OLYMPUS胃镜送水系统”一文,CBM中仅标引“胃镜检查”一个主题词,实际上原文讨论的“胃镜送水系统”是属于仪器、设备类的内容,要加副主题词“仪器与设备”限定,即“胃镜检查/仪器与设备”才符合原文含义。
1.4 中医中药学主题标引不足:主要体现在一些穴位疗法或针炙疗法时,穴位名称未加标引;或中医药疗法中的中药方剂名称或主要成份未能标出。对检索者来说,仅从疾病与副主题词“中医药疗法”、“穴位疗法”、“针炙疗法”组配查找,范围太大,增加了检索“躁声”。如“中药灌肠治疗婴幼儿腹泻224例临床观察”一文,仅标引“腹泻,婴儿/中医药疗法,灌肠”。再如“药物穴位埋藏治疗癫痫的临床研究”,仅标引“癫痫/穴位疗法”,而中药是什么、穴位埋藏的药物成份是什么都未标明,给检索者判读命中文献造成困难。
2 主题标引错误的主要原因
2.1 标引人员人为因素:由于标引人员受医学知识水平、理解问题的角度、对词表熟悉程度等限制,在实际进行主题分析、主题词选择、转换及组配副主题词时,不能客观反映作者的意图、文献所论述的事物或研究对象,造成错误标引。有些文献标引甚至违反了叙词语言的基本特征——概念组配,而造成字面组配。这是最主要的原因。
, http://www.100md.com
2.2 标引工具因素:《英汉对照医学主题词注释字顺表》的更新速度太慢,跟不上医学科学发展的节奏,目前使用的是根据1992年的《MeSH》编制的,有许多新的专业名词术语尚未收入,也未见有补充本。再者,该表对中医学主题词收录较少。《中医药主题词表》虽有中医药学主题词,但有些主题词和副主题词范围太大,作为主题词标引后显得太粗,标引深度不足。因此,建立健全统一使用的、比较合理的、能及时更新的专业主题词表,很有必要,对提高主题标引质量有积极作用。
3 建议
3.1 提高标引人员的素质:主题分析误差多由标引人员的医学专业知识、综合分析能力等因素造成,所以标引人员应不断加强自身专业知识的学习,提高标引技能,尤其要紧跟医学科学发展,准确理解医学领域的新概念、新理论,从而在实路中总结经验,提高标引工作质量,为用户提供一个高质量的主题检索系统。
3.2 减少主题标引的不一致性:首先,必须对标引工作进行全面、有效的控制,也就是要制定出一套完整的标引准则,使标引工作规范化,以保持其一致性;其次,由于各人对文献主题内容的理解角度及能力不同,对文献主题的分析结果也不尽相同,相对稳定标引人员队伍,可减少主题分析和主题标引的不一致性。
, http://www.100md.com
3.3 控制主题标引深度:从信息角度看,标引深度大,检索标识数量多,文献检索途径也多,用户检索到文献的机率就大,但也不能认为标引深度越大越好,在一定条件下,标引深度越大,查全率越高,而查准率却下降,标引误差和检索误差也会增大。标引深度过浅可能会漏掉一些有价值的检索信息而导致漏检。在实际标引中,原则上是适度标引,在保证查准率的前提下,提高查全率,对标引深度给予必要限制。
3.4 加强标引工具的系统性建设:切实加强标引工具的系统性建设,建立健全统一的、合理的、能及时更新的专业主题词表,为标引工作提供前期保证,对提高主题标引质量有积极作用。
参考文献
1 黎雯.文献主题标引质量分析.江苏图书馆学报,1998,(6)∶17~20
2 傅群.论期刊文献的主题标引.江苏图书馆学报,1998,(6)∶21~22
, http://www.100md.com
3 关淡庄,等.将CBMDISC作为现代化的医学主题词标引工具.医学情报工作,1996,17(4)∶35~38
4 孙欣,祝可珍.文献主题标引误差小议.图书馆建设,1997,(5)∶74
5 王红松,唐芬.科技期刊论文的主题标引.图书情报工作,1997,(2)∶42~44
6 冯艳娟.主题标引和主题检索的关系剖析.医学图书馆通讯,1997,(4)∶38~39
7 任淑敏,李健.医学文献检索中常用组配标引模式和规律.医学图书馆通讯,1997,(2)∶42
8 马绪超.文献主题标引中的组配问题.图书情报工作,1998,(8)∶29~32
(1999年3月10日收稿), 百拇医药