当前位置: 首页 > 医疗版 > 疾病专题 > 皮肤科 > 皮肤肿瘤 > 鳞状细胞癌
编号:13532652
舌鳞状细胞癌差异表达基因的生物信息学分析(1)
http://www.100md.com 2019年10月1日 《青岛大学学报(医学版)》 20195
     [摘要]目的 通过生物信息学分析,筛选舌鳞状细胞癌(鳞癌)组织和正常组织差异表达基因(DEGs),筛选关键基因,为进一步的研究提供参考。方法 从公共基因表达數据库(GEO)下载舌鳞癌芯片数据,利用R语言Limma程序包筛选DEGs,利用韦恩图筛选不同数据集的共同DEGs,对共同DEGs进行GO和KEGG富集分析、蛋白相互作用网络分析及网络关键基因生存分析。结果 筛选出不同数据集的共同DEGs 297个,这些基因参与血管新生、细胞黏附、氧化还原等过程,并参与细胞外基质受体相互作用通路、黏着斑通路、小细胞肺癌通路、Toll样受体信号通路和代谢通路,与舌鳞癌的发生发展密切相关。同时筛选出THBS1、CRP、HMMR、TFPI2、SDS、ANLN等6个关键基因,其表达上调,与头颈部鳞癌病人的预后显著相关。结论 筛选出的关键基因有助于加深对舌鳞癌发生发展分子机制的理解,同时可为后续的临床研究提供一定的理论依据。

    [关键词]舌肿瘤;癌,鳞状细胞;寡核苷酸序列分析;计算生物学;数据挖掘

    [中图分类号]R739.86

    [文献标志码]A

    [文章编号] 2096-5532(2019)05-0505-05

    doi:10.11712/jms201905001

    [开放科学(资源服务)标识码(OSID)]

    舌癌是口腔颌面部常见的恶性肿瘤之一,近年来其发病率有所上升。虽然现阶段以手术为主的综合治疗取得了一定的效果,但是舌癌易转移,手术切除难度大,术后易复发,手术常常造成病人语言、进食、呼吸等功能的障碍和颜面的畸形[1-2]。目前舌癌的发病机制尚未明确。因此,在分子层面上揭示舌癌的发病机制,筛选舌癌发生发展的关键基因,可能为舌癌的防治提供重要的靶点和标志物。基因芯片是一种高通量获取生物信息的技术,能高效检测并分析肿瘤组织和正常组织差异表达基因(DEGs)[3]。本研究拟通过分析基因表达数据库(GEO)提供的舌鳞状细胞癌(简称鳞癌)相关基因芯片数据,筛选DEGs,并对DEGs进行功能富集分析,构建蛋白相互作用网络,同时对关键基因进行生存分析,为进一步在分子水平研究舌鳞癌的发生发展机制,为舌鳞癌的诊断和治疗提供一定的理论依据。现将结果报告如下。

    1 资料和方法

    1.1 数据检索

    在GEO(https://www.ncbi.nlm.nih.gov/geo)中检索“tongue cancer”,下载舌鳞癌基因芯片数据。每个数据集均需符合以下条件:①实验用人舌鳞癌组织和正常组织进行比较;②数据集来自全基因组 RNA 表达芯片。

    1.2 获得DEGs

    应用R语言(https://www.r-project.org/)对基因芯片原始数据进行注释和过滤,用Bioconductor(http://bioconductor.org/)提供的RMA算法对各原始芯片数据进行背景校正及归一化等预处理。采用Limma程序包对肿瘤组织和正常组织样本的基因表达值进行比对,以表达倍数变化值的对数值(log2FC)绝对值>1且调整后P<0.05为阈值,获得各数据集的DEGs。采用韦恩图(http://bioinformatics.psb.ugent.be/webtools/Venn/)的方法获取各数据集的共同DEGs。

    1.3 GO和KEGG富集分析

    利用DAVID 6.8数据库(https://david.ncifcrf.gov/)对各数据集的共同DEGs进行GO分析和KEGG分析。

    1.4 蛋白相互作用网络分析

    利用STRING 11.0数据库(https://string-db.org/)对各数据集共同DEGs编码蛋白的相互作用进行网络分析。应用Cytoscape_v3.6.1软件插件Cytohubba寻找蛋白相互作用网络中与舌鳞癌发生发展相关的关键基因。

    1.5 关键基因生存分析

    利用KM plotter网上分析工具(http://kmplot.com/analysis/)分析DEGs表达与头颈部鳞癌病人生存期的相关性,评价通过生物信息学方法找到的关键基因对疾病预后的预测能力。登录KM plotter网站,输入基因名称,选择疾病类别,样本数设为499,cut off值设为median,绘制生存曲线,筛选有显著统计学意义的结果。统计学处理的结果以P<0.05表示差异有统计学意义。

    2 结果

    2.1 数据库检索

    共检索到3个数据集(GSE31056、GSE78060、GSE34105),其中GSE31056数据集包含24个正常样本和24个肿瘤样本;GSE78060数据集包含4个正常样本和26个肿瘤样本;GSE34105数据集包含16个正常样本和62个肿瘤样本。

    2.2 DEGs分析

    GSE31056、GSE78060和GSE34105基因芯片数据集分别筛选出DEGs为2 193、4 727和3 099个(图1A~C)。为了减少DEGs筛选结果的假阳性率,采用韦恩图取交集的方法确定3个数据集的共同DEGs为297个(图1D)。

    2.3 共同DEGs的GO和KEGG分析

    GO分析包括生物学过程(BP)、细胞组分(CC)和分子功能(MF)3部分。DEGs的BP主要富集于血管新生、细胞黏附、氧化还原过程、正向调控转录RNA聚合酶Ⅱ启动子;CC主要富集于朊蛋白细胞外基质、细胞外间隙、细胞外泌体、细胞外组分、细胞表面;MF主要富集于金属内肽酶活化、RNA聚合酶Ⅱ转录因子活性、序列特异性DNA结合、血红蛋白结合、蛋白结合。KEGG分析显示,通路主要富集于细胞外基质受体相互作用通路、黏着斑通路、小细胞肺癌通路、Toll样受体信号通路和代谢通路。见表1。, 百拇医药(王东 刘国新 董作青 杨中军 陈健)
1 2 3 4下一页


    参见:首页 > 医疗版 > 疾病专题 > 皮肤科 > 皮肤肿瘤 > 鳞状细胞癌