中医医案文献自动分词研究(3)
现代医案文献分词错误的原因主要有2点。一是引用经典中的原文,由于医古文与现代汉语的不同导致切分错误。二是现代医案文献中往往有大量现代医学的名词,如体格检查、理化检查及既往史中均有大量医学术语和药物,这些均会因为缺乏相关的词典造成切分错误。这在中西医结合治疗的医案中表现尤其明显,因本研究选取的均为纯中医治疗的医案,这部分术语的量相对很少,虽然未引入专门的词典,但对分词结果影响不大。在词性标注准确率方面,现代医案文献属于正常范围,而古代医案文献的词性标注准确率则明显偏低 ......
您现在查看是摘要页,全文长 2211 字符。