楼主 | 收藏 | 举报 2018-08-14 00:00   浏览:186   回复:2

GO和KEGG富集的R包clusterProfiler

一:下载安装该R包

clusterProfiler是业界很出名的YGC写的R包,非常通俗易懂,也很好用,可以直接根据cuffdiff等找差异的软件找出的差异基因entrez ID号直接做好富集的所有内容;

Bioconductor网站上面有关于它的介绍,按照上面说的方式来安装即可

http://www.bioconductor.org/packages/release/bioc/html/clusterProfiler.html

source(“http://bioconductor.org/biocLite.R”);biocLite(“clusterProfiler”)

转录组-GO和KEGG富集的R包clusterProfiler414

二、输入数据

diff_gene.entrez文件,是通过各种差异基因软件找出来的差异基因的entrez ID号列表,每一个ID号一行,几百个差异基因就几百行

三、R语言代码

四、输出文件解读

看得懂R语言的都知道,这个代码输出了两个文件KEGG-enrich.csv和GO-enrich.csv,就是我们的GO和KEGG富集的结果,其中内容如下

转录组-GO和KEGG富集的R包clusterProfiler1003

上述表格为差异基因的Gene Ontology富集分析结果表格。

GO ID: Gene Ontology数据库中唯一的标号信息

Description :Gene Ontology功能的描述信息

GeneRatio:差异基因中与该Term相关的基因数与整个该Term的总基因数的比值

BgRation:所有( bg)基因中与该Term相关的基因数与所有( bg)基因的比值

pvalue: 富集分析统计学显著水平,一般情况下, P-value < 0.05 该功能为富集项

p.adjust 矫正后的P-Value

qvalue:对p值进行统计学检验的q值

Count:差异基因中与该Term相关的基因数

转录组-GO和KEGG富集的R包clusterProfiler1433

上述表格为差异基因的KEGG Pathway富集分析结果表格。

ID: KEGG 数据库中通路唯一的编号信息。

Description :Gene Ontology功能的描述信息

GeneRatio:差异基因中与该ID相关的基因数与整个该Term的总基因数的比值

BgRation:所有( bg)基因中与该ID相关的基因数与所有( bg)基因的比值

pvalue: 富集分析统计学显著水平,一般情况下, P-value < 0.05 该功能为富集项

p.adjust 矫正后的P-Value

qvalue:对p值进行统计学检验的q值

Count:差异基因中与该Term相关的基因数

原文来自:http://www.bio-info-trainee.com/370.html

打赏
沙发 | 回复 | 举报 2024-11-23 19:43
换一个低版本的R试试
藤椅 | 回复 | 举报 2017-07-02 15:22
求助:安装clusterprofiler包时,package”GO.db”安装不了怎么办?
网站首页 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
 
免责声明:本站有部分内容来自互联网,如无意中侵犯了某个媒体 、公司 、企业或个人等的知识产权,请来电或致函告之,本网站将在规定时间内给予删除等相关处理。