基于文献的哈萨克医药现状可视化分析(2)
1 资料与方法1.1 数据来源
计算机检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)1990年1月-2015年12月哈医药相关研究文献。为保证查准率,将哈尔滨医科大学图书馆的简写‘哈医图’进行消歧处理,把摘要字段中含‘哈医图’关键词的题录去除。CNKI检索式为“SU=哈医 OR SU=哈萨克医 NOT AB=哈医图”,万方数据检索式为“主题:(哈医) and 主题:(哈萨克医) not 摘要:(哈医图)”。检索时间为2016年4月。
1.2 数据清洗
数据清洗是一个再审查和校验的过程,主要是清理重复信息、纠正著录格式、保证数据结构统一。将数据导入文献管理软件Endnote,以“题名”和“作者”为主码进行去重处理;人工浏览文献摘要,去除错检项、无关项;手工标引缺失字段,主要是规范作者名字、统一单位名称。
1.3 数据转换
采用可视化文献分析软件CiteSpace的Built-in Database转换功能将题录格式转换成分析工具可调用格式[1];应用文献题录信息统计分析工具SATI实现作者单位字段信息抽取 ......
您现在查看是摘要页,全文长 4311 字符。