当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2015年第2期
编号:12623806
中医医案文献自动分词研究(1)
http://www.100md.com 2015年2月1日 中国中医药信息 2015年第2期
中医医案文献自动分词研究,中医领域词典,层叠隐马模型,词性标注
     摘要:目的 研究适用于中医医案文献自动分词的方案。方法 使用层叠隐马模型作为分词模型,建立相关中医领域词典及测试语料库,对语料库中古代医案文献和现代医案文献各300篇进行分词及评测。结果 在未使用中医领域词典时,两类医案文献分词准确率均为75%左右;使用中医领域词典后,古代医案文献的分词准确率达到90.73%,现代医案文献的分词准确率达到95.66%。在未使用中医领域词典时,词性标注准确率古代医案文献为56.74%,现代医案文献为64.81%;使用中医领域词典后,现代医案文献为91.45%,明显高于古代医案文献的78.47%。结论 现有分词方案初步解决了中医医案文献的分词问题,对现代医案文献的词性标注也基本正确,但古代医案文献的词性标注影响因素较多,还需进一步研究。

    关键词:中医医案文献;自动分词;中医领域词典;层叠隐马模型;词性标注

    DOI:10.3969/j.issn.1005-5304.2015.02.012

    中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2015)02-0038-04

    Study on Automatic Word Segmentation for Traditional Chinese Medical Record Literature ZHANG Fan ......
1 2 3下一页

您现在查看是摘要页,全文长 3319 字符