当前位置: 首页 > 期刊 > 《温州医科大学学报》 > 2023年第7期
编号:610489
基于机器学习的成纤维细胞生长因子受体激酶抑制剂虚拟筛选模型
http://www.100md.com 2023年6月25日 温州医科大学学报 2023年第7期
残基,1材料和方法,2结果,3讨论
     丁俊涛,刘博,吴建章,李物兰

    1.温州医科大学 第一临床医学院(信息与工程学院),浙江 温州 325035;2.温州医科大学附属眼视光医院,浙江 温州 325000

    成纤维细胞生长因子受体(fibroblast growth factor receptors, FGFR)是一种在许多生物学过程中发挥重要作用的受体酪氨酸激酶,包括FGFR1、FGFR2、FGFR3、FGFR4四种亚型[1]。FGFR信号传导的异常激活在不同类型肿瘤(如胆管癌、子宫内膜癌、尿路上皮癌和肺癌等)的发生和进展中起重要作用[2-4],FGFR抑制剂具有治疗这些疾病的潜力。目前FGFR激酶家族中已有3种小分子靶向抑制剂在近三年被批准用于癌症治疗[5],但是随后发现它们均表现出较强的高血磷症、腹泻等不良反应,因此急需寻找出新颖先导化合物骨架用于改构成安全性更好的抑制剂。

    在新药发现领域,与实验筛选相比,虚拟筛选方法在经济成本、时间效率上极具优势[6]。目前虚拟筛选可分为传统经典的计算机辅助药物设计(computer aided drug design, CADD)[7]和现代新颖的人工智能药物设计(artificial intelligence drug design, AIDD)[8]。在面对千万级以上大数据库的虚拟筛选方面,AIDD的效率远高于CADD。在已报道的FGFR抑制剂中,部分是基于CADD的新药发现,未见基于AIDD的抑制剂研究。因此,本研究建立了基于AIDD的FGFR激酶抑制剂虚拟筛选模型,选择FGFR四种受体中与肿瘤等疾病关系密切的FGFR1,将AIDD筛选得到的化合物用CADD进一步进行了FGFR1激酶抑制剂的虚拟筛选和分子动力学模拟研究,旨在为FGFR抑制剂的研究提供高效AIDD筛选模型和苗头化合物。

    1 材料和方法

    1.1 FGFR激酶抑制剂数据整理由于FGFR1-4激酶结构,尤其是FGFR1-3,高度相似,因此目前已报道的FGFR激酶抑制剂绝大部分是泛FGFR抑制剂。将BindingDB公共药物实验数据集[9]导入Mysql[10]软件进行整理查询,获得2196条FGFR激酶抑制剂实验数据,并将半数抑制浓度小于100 nmol/L的记为活性数据,标签值为1,其余的记为非活性数据,标签值为0。在对数据进行清洗、去重、标签等操作后,最终得到活性数据1275条,非活性数据921条,作为后续处理和训练的数据集合。

    1.2 分子的特征工程采用两种分子特征表示方法:①分子指纹MACCS[11]:包含166位分子指纹 ......

您现在查看是摘要页,全文长 10617 字符