中医药信息学工程技术领域研究进展(1)
摘要:工程技术在中医药信息学发展过程中发挥着重要的作用,不仅是在解决现实问題方面,而且对学科理论的发展也有着重要的促进作用。中医药信息学在工程技术领域中的研究主要体现在3个方面:中医药科学数据建设工程、中医药信息标准建设工程和中医药知识服务工程。中医药信息学工程技术领域的发展支撑着整个学科在应用领域中的发展。
关键词:中医药信息学:工程技术:中医药信息标准:中医药科学数据:中医药知识服务
中图分类号:R-058;R2-05 文献标识码:A 文章编号:2095-57070016)01-0009-06
白春礼院士在谈到创新驱动发展时指出,“应积极促进技术、工程与经济社会紧密结合,发挥技术创新在支撑当前经济转型和持续发展中的核心作用……加强产学研合作,推动科研院所、大学与企业共建技术研发平台、创新联盟,打通创新链与产业链,集中力量突破关键核心技术……要采取多种切实有效的举措,综合施策,努力通过技术创新支撑当前经济转型增效,通过创新驱动打造经济升级版”。中医药信息技术、信息工程研究与中医药临床实践、新药研发紧密结合,在支撑中医药创新驱动发展中具有重要的作用。中医药信息学在工程技术领域中的研究主要体现在3个方面:中医药科学数据建设工程、中医药信息标准建设工程和中医药知识服务工程。
1中医药科学数据建设工程
中医药科学数据建设是一项浩大的工程,对中医药学的发展具有深远影响,主要体现在当科学数据成为一种资源,支撑着科学研究的第四范式——数据科学时,对中医药学科学研究的推动作用将与理论研究和实验研究发挥同样重要的作用。
中医药科学数据建设工程起源于20世纪80年代初,以文摘数据库建设为起点。由于吴兰成研究员的远见,在数据库建设之初就与美国国立医学图书馆的MEDLINE数据库采用了相同的建设模式,即运用主题标引的方法加强数据库的查全率与查准率。为了贯彻这一思想,首先必须建设与《医学主题词表》(MeSH)相配套的中医药学主题词表,才能够实现主题检索。中医药学主题词表采用了与MeSH词表相一致的结构,把其未收录的、而在中医药科学文献中又频繁出现的概念编制成中医药学主题词表,用于中国中医药期刊文献数据库的标引。经过主题词标引的中国中医药期刊文献数据库具有更为精确的查准率和更为全面的查全率,成为当时国内外主要应用的中医药文献数据库。在数据库建设初期,收录了国外多语种期刊发表的与中医药相关的文献;后来由于经费和人员等原因,不再收录中文以外的文献,文摘量也逐渐减少。进入21世纪后,受清华同方、万方数据等全文数据库的影响,中国中医药期刊文献数据库的建设受到了很大的冲击,用户量逐渐减少。但随着信息爆炸,无效文献越来越多,单凭关键词检索越来越无法满足用户的需求,主题词检索又引起了用户的注意。因此,到目前为止,文摘型的中国中医药期刊文献数据库凭借着其特有的主题词标引,依然吸引着一批用户。
进入20世纪90年代后,随着对数据需求的不断增加,国家在科学研究基础条件建设方面逐渐加大投入,对中医药科学数据建设经费的投入也不断加大,此时产生了一大批单表型数据库,如中国中药数据库、中国方剂数据库、疾病诊疗数据库等。这批数据库的建设主要是为了满足临床和科研人员对某一方面数据的需求。在此基础上,中医药数据库群逐渐形成,中医药科学数据平台初见雏形。
20世纪90年代末期至21世纪初期,是中医药科学数据建设工程最为活跃的时期。由于多学科的介入,中医药科学数据建设与清华大学、浙江大学、中国科学院计算技术研究所、中国科学院软件研究所等一批具有强大计算机研究实力的单位形成合作关系,开展中医药科学数据建设研究。与此同时,由于国家经费支持力度不断加大,对中医药科学数据建设的要求不断提升,加之中医药科学数据建设单位的规模均偏小,因此,中医药科学数据建设虚拟研究院应运而生。
在此期间,中医药科学数据建设转向了结构型数据库,试图通过数据拆分、数据清洗、数据关联实现数据间关联关系的发现。通过不断的磨合,最终中国中医科学院中医药信息研究所与浙江大学计算机科学与技术学院建立了长久、稳定的合作关系,共同开发与建设中医药科学数据平台,这项合作至今已经持续了17年。在此平台上,我们建立了中药基础数据库,实现了中药数据间的关联检索与统计功能,能在数秒内完成所有中药的归经、性、味统计,化学成分与中药关联检索,中药与功效关联检索等;中药药理数据仓库基于8个轴,实现了中药材、化学成分的药理作用频次、药理实验频次排序及相关文献关联;中国中药化学成分数据库实现了化学成分与实验条件的关联;还有一大批疾病数据库,实现了各种疾病证候、症状、方剂、中药、西药的统计,以及诊断标准的关联等。在中医药科学数据平台上建设了42个结构型数据库,并实现免费共享。
中医药信息研究单位规模都相对较小,人员结构不尽合理,仅依靠1~2个中医药信息研究单位难以承担如此浩大的工程。为此,建立了中医药科学数据工程虚拟研究院(以下简称虚拟研究院)。虚拟研究院相对稳定,但也在不断的变化之中,成员最多时有37个中医药大学、学院、研究院所及西医相关单位和计算机研究相关单位参与建设。虚拟研究院之所以能够相对稳定,并一直持续到现在,主要是其组成结构、运作模型及操作平台相对合理。虚拟研究院的组成结构是纵横支撑,横向为各组成单位是稳定的事业单位组织,保证了组织机构的稳定性,纵向是各数据库形成的课题组,保证了参加人员的稳定性。其运行机制主要是依托课题项目,按课题项目的运行机制,同时实行协调管理,即人力集成虚拟化、组织结构柔性化、知识产权模糊化、并行作业分布化。虚拟研究院的操作平台是面向Intemet的中医药异地、远程、同步数据共建平台,在这个平台上部署了3级审校程序、3级权限管理程序,实现了全国范围内的中医药科学数据共建。
目前,中医药科学数据建设工程正在向提高数据质量、服务临床与科学研究需求方向努力。同时,随着大数据理念及数据科学理念的逐步发展,数据应用理念也在逐渐发生变化,正在探索通过Hadoop平台上的MapReduce,在计算机上从全文本数据中自动抽取所需要数据,实现数据的半自动结构化和半自动关联,并逐渐回归中医药数据的本体,不再追求从所有数据中发现中医药的一般规律,而是基于1个医生、1个科室、1个医院、1个流派的全数据发现具有个体化特征的经验性规律。随着国家科技立法的进程不断推进,中医药科研数据汇交最终能够实现,为中医药科学数据建设工程奠定更为坚实的基础。而中医药科学数据建设工程的持续推进,最终也将为中医药学的发展做出应有贡献。, 百拇医药(崔蒙 李海燕 杨硕 高博 胡雪琴 朱玲)
关键词:中医药信息学:工程技术:中医药信息标准:中医药科学数据:中医药知识服务
中图分类号:R-058;R2-05 文献标识码:A 文章编号:2095-57070016)01-0009-06
白春礼院士在谈到创新驱动发展时指出,“应积极促进技术、工程与经济社会紧密结合,发挥技术创新在支撑当前经济转型和持续发展中的核心作用……加强产学研合作,推动科研院所、大学与企业共建技术研发平台、创新联盟,打通创新链与产业链,集中力量突破关键核心技术……要采取多种切实有效的举措,综合施策,努力通过技术创新支撑当前经济转型增效,通过创新驱动打造经济升级版”。中医药信息技术、信息工程研究与中医药临床实践、新药研发紧密结合,在支撑中医药创新驱动发展中具有重要的作用。中医药信息学在工程技术领域中的研究主要体现在3个方面:中医药科学数据建设工程、中医药信息标准建设工程和中医药知识服务工程。
1中医药科学数据建设工程
中医药科学数据建设是一项浩大的工程,对中医药学的发展具有深远影响,主要体现在当科学数据成为一种资源,支撑着科学研究的第四范式——数据科学时,对中医药学科学研究的推动作用将与理论研究和实验研究发挥同样重要的作用。
中医药科学数据建设工程起源于20世纪80年代初,以文摘数据库建设为起点。由于吴兰成研究员的远见,在数据库建设之初就与美国国立医学图书馆的MEDLINE数据库采用了相同的建设模式,即运用主题标引的方法加强数据库的查全率与查准率。为了贯彻这一思想,首先必须建设与《医学主题词表》(MeSH)相配套的中医药学主题词表,才能够实现主题检索。中医药学主题词表采用了与MeSH词表相一致的结构,把其未收录的、而在中医药科学文献中又频繁出现的概念编制成中医药学主题词表,用于中国中医药期刊文献数据库的标引。经过主题词标引的中国中医药期刊文献数据库具有更为精确的查准率和更为全面的查全率,成为当时国内外主要应用的中医药文献数据库。在数据库建设初期,收录了国外多语种期刊发表的与中医药相关的文献;后来由于经费和人员等原因,不再收录中文以外的文献,文摘量也逐渐减少。进入21世纪后,受清华同方、万方数据等全文数据库的影响,中国中医药期刊文献数据库的建设受到了很大的冲击,用户量逐渐减少。但随着信息爆炸,无效文献越来越多,单凭关键词检索越来越无法满足用户的需求,主题词检索又引起了用户的注意。因此,到目前为止,文摘型的中国中医药期刊文献数据库凭借着其特有的主题词标引,依然吸引着一批用户。
进入20世纪90年代后,随着对数据需求的不断增加,国家在科学研究基础条件建设方面逐渐加大投入,对中医药科学数据建设经费的投入也不断加大,此时产生了一大批单表型数据库,如中国中药数据库、中国方剂数据库、疾病诊疗数据库等。这批数据库的建设主要是为了满足临床和科研人员对某一方面数据的需求。在此基础上,中医药数据库群逐渐形成,中医药科学数据平台初见雏形。
20世纪90年代末期至21世纪初期,是中医药科学数据建设工程最为活跃的时期。由于多学科的介入,中医药科学数据建设与清华大学、浙江大学、中国科学院计算技术研究所、中国科学院软件研究所等一批具有强大计算机研究实力的单位形成合作关系,开展中医药科学数据建设研究。与此同时,由于国家经费支持力度不断加大,对中医药科学数据建设的要求不断提升,加之中医药科学数据建设单位的规模均偏小,因此,中医药科学数据建设虚拟研究院应运而生。
在此期间,中医药科学数据建设转向了结构型数据库,试图通过数据拆分、数据清洗、数据关联实现数据间关联关系的发现。通过不断的磨合,最终中国中医科学院中医药信息研究所与浙江大学计算机科学与技术学院建立了长久、稳定的合作关系,共同开发与建设中医药科学数据平台,这项合作至今已经持续了17年。在此平台上,我们建立了中药基础数据库,实现了中药数据间的关联检索与统计功能,能在数秒内完成所有中药的归经、性、味统计,化学成分与中药关联检索,中药与功效关联检索等;中药药理数据仓库基于8个轴,实现了中药材、化学成分的药理作用频次、药理实验频次排序及相关文献关联;中国中药化学成分数据库实现了化学成分与实验条件的关联;还有一大批疾病数据库,实现了各种疾病证候、症状、方剂、中药、西药的统计,以及诊断标准的关联等。在中医药科学数据平台上建设了42个结构型数据库,并实现免费共享。
中医药信息研究单位规模都相对较小,人员结构不尽合理,仅依靠1~2个中医药信息研究单位难以承担如此浩大的工程。为此,建立了中医药科学数据工程虚拟研究院(以下简称虚拟研究院)。虚拟研究院相对稳定,但也在不断的变化之中,成员最多时有37个中医药大学、学院、研究院所及西医相关单位和计算机研究相关单位参与建设。虚拟研究院之所以能够相对稳定,并一直持续到现在,主要是其组成结构、运作模型及操作平台相对合理。虚拟研究院的组成结构是纵横支撑,横向为各组成单位是稳定的事业单位组织,保证了组织机构的稳定性,纵向是各数据库形成的课题组,保证了参加人员的稳定性。其运行机制主要是依托课题项目,按课题项目的运行机制,同时实行协调管理,即人力集成虚拟化、组织结构柔性化、知识产权模糊化、并行作业分布化。虚拟研究院的操作平台是面向Intemet的中医药异地、远程、同步数据共建平台,在这个平台上部署了3级审校程序、3级权限管理程序,实现了全国范围内的中医药科学数据共建。
目前,中医药科学数据建设工程正在向提高数据质量、服务临床与科学研究需求方向努力。同时,随着大数据理念及数据科学理念的逐步发展,数据应用理念也在逐渐发生变化,正在探索通过Hadoop平台上的MapReduce,在计算机上从全文本数据中自动抽取所需要数据,实现数据的半自动结构化和半自动关联,并逐渐回归中医药数据的本体,不再追求从所有数据中发现中医药的一般规律,而是基于1个医生、1个科室、1个医院、1个流派的全数据发现具有个体化特征的经验性规律。随着国家科技立法的进程不断推进,中医药科研数据汇交最终能够实现,为中医药科学数据建设工程奠定更为坚实的基础。而中医药科学数据建设工程的持续推进,最终也将为中医药学的发展做出应有贡献。, 百拇医药(崔蒙 李海燕 杨硕 高博 胡雪琴 朱玲)