当前位置: 首页 > 期刊 > 《中国中医药图书情报》 > 20202
编号:13492719
中医病历术语识别方法探讨(1)
http://www.100md.com 2020年4月1日 《中国中医药图书情报》 20202
中医病历术语识别方法探讨,命名实体识别,长短时记忆神经网络,条件随机场,中医电子病历
     摘要:目的 探索中医领域利用少量标注语料进行电子病历中医学实体信息的命名实体识别(NER)研究工作,为更复杂的中医电子病历信息处理及深度学习方法在中医领域内的运用提供参考。 方法 分析中医电子病历词汇术语与一般的NER任务相比较的特殊性,对比了目前3种NER技术的优缺点,找寻适合中医电子病历医学术语的NER技术。结果 长短时记忆神经网络(LSTM)是一种无监督学习模型,能有效利用序列数据中长距离依赖信息,特别适合处理文本序列数据;还可以和条件随机场(CRF)模型相结合,解决中医NER的难点。长短时记忆神经网络联合条件随机场模型(LSTM-CRF)可以在未标记的病历文本语料上无监督学习词语特征,不依赖于人工设计特征模板而达到自动提取患者症状、疾病、诱因等命名实体的目的。结论 中医电子病历术语识别应利用多种命名实体识别技术,充分发挥这些技术的优势,提高模型识别准确性。

    关键词:命名实体识别;长短时记忆神经网络;条件随机场;中医电子病历

    中图分类号:R241;TP391.1 文献标识码:A 文章编号:2095-5707(2020)02-0001-05

    DOI: 10.3969/j.issn.2095-5707.2020.02.001

    Abstract: Objective To explore how to use the small amount of labeled corpora in the field of TCM to conduct research on named entity recognition (NER) of medical entity information in electronic medical records (EMR); To provide references for the application of more complex information processing of TCM EMR and in-depth learning methods in the field of TCM. Methods Specificity of vocabulary and terminology of TCM EMR compared to general NER tasks was analyzed ......
1 2 3 4 5下一页

您现在查看是摘要页,全文长 3570 字符