当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2013年第10期
编号:13151281
基于文献标引词频统计的《中国中医药学主题词表》选词研究(2)
http://www.100md.com 2013年10月1日 《中国中医药信息》 2013年第10期
     从词频≥10次的关键词分类来看,属于原标引概念不准确、无实际意义或属于文献类型、年龄分类等的576个关键词应当剔除。属于2007年版《词表》未收录的中药制剂和近5年研究较多的技术与方法的368个关键词,初步推荐为预选新主题词或入口词。属于文献类型、年龄分类、实验动物、年代的关键词,已在标引文献类型、特征词、实验动物品种、医学史中表达,没必要作为主题词。其余的2541个关键词在2007年版《词表》中已收录同一概念的主题词,只能在词表修订时,根据实际需要从中选择入口词。

    3 讨论

    3.1 主题词

    通过2008-2012年《中国中医药期刊文献数据库》中标引主题词的词频统计,对主题词的应用情况有了基本了解,也发现主题词在使用过程中的一些问题。经过与2007年版《词表》中的主题词对照发现,有1374个中医主题词在标引中未被使用,说明词表中有大量无文献保证的词汇充斥其中,在修订时应该对这些词逐个进行分析,看是否有必要保留或进行归并。从15个类目主题词使用情况统计看,利用率最低的是药用动植物类(69.97%),其次是自然科学类(71.01%)和中医精神疾病和心理学类(82.81%),这三类主题词,特别是药用植物与药用动物子类目的主题词在修订时应重点关注。
, 百拇医药
    另外,从高频主题词来看,“复方”、“中药化学成分”、“中成药”、“辨证论治”和“辨证分型”都属于概念很大的主题词,频次高的原因,一方面是由于主题词表中供选择的专指主题词不够多,另一方面可能是文献标引时未标出与原文主题概念完全对应的最专指的主题词。排在首位的“复方”词频数高达65 910次,占文献总数的26.8%,考虑可能是自拟方较多,现有的主题词无法表示。其次是“中药化学成分”和“中成药”,原因可能是中药化学成分和中成药种类多,供选择的中药化学成分或中成药具体专指词不够多,建议修订时适当增加相关主题词。“辨证论治”和“辨证分型”频次高反映了中医临床的特点,原因可能是证型专指词不够多或具体证型未标出。“名医经验”频次高与研究相关内容的文献比较多有关。而“黄芪”、“丹参”、“当归”、“大黄”、“柴胡”、“白术”、“党参”频次高表明这几味药是中药组方中的常用药。

    3.2 关键词

    在主题词表修订过程中,文献中的高频关键词应该是选择新增主题词和入口词的重要来源。但由于数据库中的部分关键词为非专业人员标引,未参照《词表》或主题词标引规则进行标引,造成许多概念提取不准确,使许多高频关键词无法作为新主题词和入口词的预选对象。建议在数据库建库时,专业人员标引主题词的同时,对已有关键词进行规范,为今后《词表》的修订选词奠定基础。
, 百拇医药
    本研究只对词频≥10次的关键词进行了分类,统计结果具有一定的局限性。而实际上词频<10次的关键词,也可能是有意义的,有待于词表修订时继续分类与筛选。

    4 结语

    本文从词频统计的角度为新版《词表》修订选词提供了一些依据,具体修订还需考虑选词的科学性和实用性,是否能够反映学科发展的新成果、新动态,并兼顾到边缘学科和交叉学科的发展,以及词语的规范化和标准化等因素,使修订后的《词表》更好的为数据库建设和检索发挥作用。

    参考文献:

    [1] 吴兰成.中国中医药学主题词表[M].北京:中国中医古籍出版社,2007.

    [2] 范为宇,苏大明,胡艳敏,等.有关中英文版中医药学主题词表的研究[J].医学信息学杂志,2007,28(4):411-413.

    [3] 苏大明,吴兰成,朱冬生,等.基于编程技术的中医药学主题词表修订[J].国际中医中药杂志,2007,29(4):209-212.

    [4] 卜书庆,陈树年.《中国分类主题词表》修订的整体构想[J].中国图书馆学报,2000,26(6):13-16.

    (收稿日期:2013-05-12,编辑:华强), 百拇医药(温先荣等)
上一页1 2