中医药知识图谱研究现状及发展趋势
本体,1知识图谱概念及特点,2中医药知识图谱构建关键技术,1知识抽取,2知识融合,3知识存储,4知识推理,3中医药知识图谱应用研究,1中医基础理论知识图谱研究,2中医临床知识图谱研究,3中医方药知识图谱研究,4中医知识图谱方法
王松,李正钧,杨涛,胡孔法,3(1.南京中医药大学人工智能与信息技术学院,江苏 南京 210023;2.南京中医药大学中医药文献研究所,江苏 南京 210023;3.江苏省中医药防治肿瘤协同创新中心,江苏 南京 210023)
自2012年5月谷歌(Google)正式推出知识图谱搜索引擎服务,知识图谱得到广泛关注和应用。中医药领域知识体系具有规模庞大、内涵丰富、关系复杂等特点。知识图谱作为资源管理和知识应用的重要技术,应用于中医药领域能够更加有效地描述、挖掘实体间的关系,使大规模知识存储更为规范、应用更加高效,实现中医药资源的有效整合,为知识服务相关研究奠定基础,为中医药传承和发展提供新的思路。
1 知识图谱概念及特点
知识图谱是一种以图的形式描述知识发展进程与内部相关关系的技术方法[1],本质上是一种大规模的语义网络,是实现知识网络可视化的有效载体[2]。知识图谱是由节点和边组成的具有有向图结构的知识表示方式,其中节点表示实体,边代表实体之间的语义关系。知识图谱与本体联系紧密,本体侧重于表达认知的概念框架,知识图谱旨在以图谱的形式直观、准确地描述实体或概念本身及其之间的关系,故在知识图谱构建时,模式层构建实质上就是在完成本体定义的任务[3-4]。
知识图谱根据知识覆盖范围分为通用知识图谱和领域知识图谱类。通用知识图谱体量大,覆盖面广,代表性的知识图谱包括DBpedia[5]、YAGO[6]等;领域知识图谱对知识的深度和精度有更高要求,应用形式更广泛,如中国中医科学院中医药信息研究所基于中医药学语言系统构建中医药知识图谱,实现综合型知识检索、问答以及决策等智能应用[7]。
2 中医药知识图谱构建关键技术
目前,构建知识图谱的整体技术路线如图1所示,中医药领域知识图谱的构建流程同样包括知识抽取、知识融合、知识存储和知识推理等多种关键技术,下面选择主要技术逐一简要介绍。
图1 知识图谱构建技术路线
2.1 知识抽取
知识抽取的目标是从不同来源数据中以自动或半自动的方式抽取知识。数据来源主要分为结构化数据、半结构化数据和非结构化数据三种。不同类型数据,抽取的方法也不同。结构化数据主要分为关系数据库和链接数据,可通过直接映射、图映射等方法进行知识抽取;半结构化数据主要分为百科类数据和普通网页数据 ......
您现在查看是摘要页,全文长 15175 字符。