基于细菌16S rRNA 基因扩增子测序数据的系统发生树图制作方法
物种,聚类,1材料与方法,2结果,3讨论
丁 可,阎星羽,廉振颖,成丽娟,刁玉涛,王家林(1.山东第一医科大学,山东 泰安 271016;2.山东第一医科大学基础医学院/基础医学研究所,山东 济南 250062;3.山东中医药大学第二附属医院,山东 济南 250001;4.山东第一医科大学附属肿瘤医院,山东 济南 250117)
细菌微生物16S rRNA 基因扩增子二代测序数据分析的后续任务之一是通过系统树形图(dendrogram/phylogenetic tree)展示微生物种群之间在进化或种系发生上的相互关系情况,dendrogram/phylogenetic tree 图分3 种类型,分别为进化分支图(cladogram),仅有拓扑结构,不能从数量上说明各分支间进化距离的大小;系统发生(发育)图(phylogram),各分枝长度表示碱基替换数,因而能从数量上说明各分支间进化距离的大小;时序图(chronogram)则用各分枝长度表示进化时间,其中系统发生图(phylogram)无疑是微生物分子遗传学研究最常用到的图形化方法[1]。目前系统发生图制作软件生成的系统发生树文件为Newick 和Nexus 格式,并且大多数系统发生树查看软件也主要兼容上述2 种文件格式,但Newick 和Nexus 格式的树文件只包含物种间的遗传距离和进化拓扑关系,结构比较单一。而R语言中的“ggtree”包对ape、ggplot2 等绘图包的功能进行了优化,“ggtree”除了能支持众多的树文件格式,其绘图方法更丰富,绘制的图形更准确和美观,最大的优点是能通过各种附加信息对树形图进行多方面的注释[2]。因此,本研究构建了微生物基因组扩增子二代测序数据的系统发生树形图的制作流程,通过QIIME 命令代码对测序数据进行预处理,聚类生成OTUs 表数据,对OTUs 表格数据进行筛选和转换,并用QIIME 分析管道(pipeline)的相关命令生成Newick 格式的系统发生树文件,以此文件为输入,用R 语言“ggtree”包的函数和代码绘制包含更多研究信息的不同类型的系统发生树图,现将结果报道如下。
1 材料与方法
1.1 数据来源 分析数据来自文献所用的原始测序数据[3],基于人体微生物在不同部位并随时间推移的变化,通过QIIME 分析方法,只选取其中的部分数据,即每天分别从2 个人的舌部、左手手掌、右手手掌和肠道共取得34 个标本,在Illumina HiSeq 2000 平台上进行微生物16s rDNA 扩增子测序。此外,从“https://data.qiime2.org/2017.6/tutorials/moving-pictures/emp -single -end -sequences/barcodes.fastq.gz”网站获得经过整理后的单向测序的数据 ......
您现在查看是摘要页,全文长 11508 字符。