当前位置: 首页 > 期刊 > 《中国中医药图书情报》 > 20165
编号:13623695
基于多特征条件随机场的《金匮要略》症状药物信息抽取研究(1)
http://www.100md.com 2016年10月1日 《中国中医药图书情报》 20165
     摘要:目的 结合自然语言处理方法,研究可以有效抽取中医古籍中所含症状和药物文本实体信息的方法。方法 以《金匮要略》为例,采用条件随机场(CRF)算法,先将文本进行分词处理,然后以词性、基于键值对的中医诊断标记集作为辅助特征,通过症状-药物BIO标签为训练特征来训练出模型,然后利用该模型对测试集文本进行自动标签标注。结果 基于多特征CRF自动标注的结果准确率达到84.5%,召回率达到70.9%,F测度值达到77.1%。结论 运用CRF方法加入词性、中医诊断标记集特征集进行训练得出的多特征模型,能有效提高CRF算法对中医古籍的实体抽取能力,生成的模型可用来自动化抽取中医古籍文本的症状药物实体信息。

    关键词:条件随机场;《金匮要略》;症状药物信息抽取;中医古籍

    中图分类号:R222.3 文献标识码:A 文章编号:2095-5707(2016)05-0014-04

    Research on Symptom and Medicine Information Abstraction of TCM Book Jin Gui Yao Lue Based on Conditional Random Field

    YE Hui1 ......
1 2下一页

您现在查看是摘要页,全文长 3388 字符