基于本体的中风病康复古今术语库构建方法研究(2)
第1页 |
参见附件。
此语义关系模型平面以上为中风病康复的类及类层次结构,实线箭头表示isa的隶属关系。平面中术语为中风病康复本体的实例,所归属的子类显示在平面上方。术语之间的语义关系包括引起、现象表达、概念部分、类似概念,具体与“肝阳暴亢证”相关的概念表达如下:肝阳暴亢证有偏瘫、口眼歪斜、偏身麻木、语言不利、面红目赤等现象表达;肝阳暴亢证被镇肝熄风汤、菊花决明枕、芹菜枣仁汤等治疗;肝阳暴亢证是中风病的概念部分;肝阳暴亢证由暴怒引起;肝阳暴亢证与肝阳上亢证是类似概念。
综上所述,中风病康复的各个大类形成了一个有机的整体并能体现中医辨证论治的原则。通过对所收集概念、术语、词汇的解析,分析了中风病康复领域中存在的语义关系(等级关系与相关关系),通过语义关系联系概念、术语,形成了一个复杂的语义网络。
2.3 中风病康复术语的规范
对从文本集抽取的术语的规范包括多个步骤,图3描述了术语规范的基本过程。
首先将从古籍与现代文本中采集的相关词条归类成病名、病因、病机、证候、症状、康复方法等,初步形成术语集。《中国中医药学主题词表》为国内外第一部被医学及中医药学信息界广泛采用的中医药学专业主题词表。词表具有词语标准化、规范化、收词完备、实用性强、与国际权威医学词表MeSH兼容等特点[12],是国内中西医大型数据库建设的支撑。因此,本研究首先通过《中国中医药主题词表》把已经规范的术语甄选出来,做为本体实例加工首选的概念词。如果该术语在词表中缺失,则通过相关的中医专业工具书查找补充并记录其定义。
通过《中国中医药学主题词表》、中医专业工具书对术语的明晰后,接着是对术语的合并、整理与标注,主要包括多词一义的规范、古今术语的沟通、一词多义的标注。
2.3.1 多词一义的规范 多词一义的规范即对同义词与近义词的合并。历代中医药文献记载的自然语言中,存在着大量的字面形式不同、但含义相同的词,使同一主题的文献可能被分散在同义词及其他异形词之下,这种情况由于年代的久远表现得更加突出。如描述中风病症状神昏相关词汇就包括不识人、卒倒无知、神昏仆倒、昏愦、昏不知人、昏迷、昏冒、不醒人事、昏仆、迷蒙、昏厥、神识时明时昧、神识冒昧、神识恍惚、昏倒、人事不省、昏蒙等。在构建本体的过程中遵循清晰性原则,以《中国中医药学主题词表》、《中医名词术语精华词典》等工具书为标准 ......
您现在查看是摘要介绍页,详见PDF附件。