关于中医药科学数据建设的思考(2)
与此同时,中医药科学数据的深度利用研究也蓬蓬勃勃地开展起来。基于结构型数据库的数据挖掘工作取得了很大的进展,在方剂配伍规律、证候组合规律、名老中医用药规律等方面开展了大量的研究工作。在浙江大学计算机科学与技术学院的支持下,搭建了高性能计算平台,支持50个节点的并行运算,运算峰值达每秒万亿次;研制了支持虚拟研究院工作的DartGrid平台,实现了全国37家单位的远程协同建库工作;研制了支持知识服务的DartCloud云平台,构建了知识服务平台的智慧应用中心,极大地促进了中医药科学数据的深度利用。当大数据理念提出后,我们提出了中医药数据所具有的2个鲜明特色,即中医药数据是全数据、是知识密集型数据,并开始研制基于大数据的应用平台,更加关注非结构化数据的处理、混杂数据的处理,以及数据间的相关关系,对基于中医药科学数据的知识服务展开了更加深入的研究。
在取得成绩的同时,我们也发现了在中医药科学数据建设和利用中存在的问题,这些问题有可能延缓中医药科学数据建设与利用达到更高水平和更快发展的速度。因此,必须认真思考和解决这些问题。
2 中医药科学数据建设的问题及解决方案
2.1 建立稳定的虚拟研究院队伍
中医药科学数据建设单位的规模一般不很大,依靠一个单位开展大型数据库的建设和利用非常困难。另外,一个重大研究项目常常横跨多个学科,应综合应用多种研究方法探讨其独特规律[1]。因此,以项目为依托,紧密联合多所大学及研究院编制内的实体研究机构或科研小组的、全国性的协同工作在中医药科学数据建设中至关重要。而已经建立起来的虚拟研究院是成功的范例 ......
您现在查看是摘要页,全文长 6248 字符。