KEGG通路注释及富集分析
KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库。KEGG该数据库有助于把基因及表达信息作为一个整体的网络进行研究。KEGG整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(PATHWAY)、药物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因组(GENOME)等。
1. 所有鉴定蛋白KEGG Mapping结果统计
蛋白质 mapping 结果统计表
2. 所有鉴定蛋白KEGG结果注释统计
KEGG 注释结果统计表
3. KEGG通路注释统计
在生物体内,不同的基因产物相互协调来行使生物学功能,对差异表达基因的通路(Pathway)注释分析有助于进一步解读基因的功能。差异表达蛋白的通路注释图,如下:
图1 KEGG注释结果通路图
注:相对于对照组来说,红色框标记的酶与上调蛋白有关,绿色框标记的酶与下调蛋白有关。蓝色框标记的酶与上调和下调蛋白均有关,框内的数字代表酶的编号(EC number),而整个通路由多种酶催化的复杂生化反应构成,此通路图中与差异表达基因相关的酶均用不同的颜色标出,根据研究对象间的差异,重点研究某些代谢通路相关蛋白的差异表达情况,通过通路解释表型差异的根源。
4. KEGG通路分类
对差异表达基因KEGG的注释结果按照KEGG中通路类型进行分类,结果如下图所示:
图2 差异表达蛋白的KEGG分类图
注:纵坐标为KEGG代谢通路的名称,横坐标为注释到该通路下的蛋白个数及其个数占被注释上的蛋白总数的比例。
5. KEGG通路富集分析
分析差异表达蛋白在某一通路上是否过出现(over-presentation)即为差异表达蛋白的通路富集分析。我们采用Kobas软件进行差异表达蛋白的KEGG通路富集分析。差异表达蛋白的KEGG通路富集分析结果见下图
图3 差异表达蛋白KEGG通路富集统计图
注:图中每一个点表示一个KEGG通路,通路名称见左侧坐标轴。横坐标为富集因子(Enrichment Factor),表示差异表达蛋白中注释到该通路的蛋白比例与该物种蛋白注释到某通路的蛋白比例的比值。富集因子越大,表示差异蛋白在该通路中的富集显著性越可靠。
How to order?