当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2019年第7期
编号:13367791
基于TF-IDF算法的方剂构成相似度可视化研究(2)
http://www.100md.com 2019年7月1日 《中国中医药信息杂志》 2019年第7期
     不同研究者从多角度进行了方剂的相似度研究,取得了一定成绩。操牡丹等[2]在《中医药方剂近似度模型》中提出基于字符串的方剂名称的相似度计算,分别应用基于编辑距离的算法、基于最大公共字符串的算法和基于统计和字典的名称相似度算法,在方剂名称层面进行研究。黄运高等[3]在《基于K-means和TF-IDF的中文药名聚类分析》中使用TF-IDF方法计算药名相似的方法并采用K-means聚类算法进行药名的聚类。朱志鹏等[4]在《基于LDA主题模型的中医药方剂相似度计算》中利用LDA主题模型发掘“方剂-证型-组成成分”的隐含关系的方法,将“方剂-组成成分”转换成“方剂-证型”和“证型-组成成分”2个概率分布,并利用KL距离来计算相似度,但由于在LDA主题模型中马氏链的平稳状态需要迭代多少次才能到达却很难确定,所以迭代次数只能依赖人为设置。顾铮[5]《基于文本分类技术计算中医方剂相似度》利用自然语言处理领域的知识,基于KNN算法,计算方剂相似度,而KNN算法中K值的选择直接影响计算结果。

    本研究从方剂的药物组成层面,在计算过程中根据药物的重要程度依照TF-IDF算法赋予其权值 ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 4262 字符