写在前面
拿到多组学的数据后一直在找合适的方法将二者进行关联,比如我这里是三种体液的代谢组与一种体液的宏基因组。需求是对多组学进行关联分析,直到最近看到不少文章里利用Gephi将相关性表格进行可视化的图,效果还不错,于是写个过程记录自用。这里演示的是属水平的差异菌群相对丰度(宏基因组结果)与代谢组鉴定到的差异代谢物进行关联。
主要分为两个部分:
- 先是计算相关性生成
graphml格式文件 - 使用Gephi软件进行可视化
数据准备
主要就是两个需要关联的表格
-
差异代谢物表格

-
差异菌属的相对丰度表格

这里注意:原文件如果是新建的excel,默认有3个sheet,一定记得只保留一个sheet后另存为制表符分隔的txt文件,这一点很重要,不然下面分析的时候会从读取就开始报错!

R包Hmisc计算相关性并用igraph包生成graphml
用到Hmisc包和igraph包
这里就直接放代码吧,遇到相关的报错先仔细检查数据,一般是数据格式和内容本身的问题。不行就上网找解决办法。
###微生物和代谢物的相关性网络
##计算微生物类群丰度和代谢物鉴定强度的相关系数
setwd('F:\\Analysis\\RA_Sanhe cow\\Microgenome\\Network_Gephi module_Pretreat\\RE group\\M_metabolites_genus')
library(Hmisc)
MAG <- read.delim('differ_genus.txt',row.name = 1, check.names = FALSE)
Enzyme <- read.delim('milk_differ_metabolites_inform.txt',row.name = 1, check.names = FALSE)
MAG

本文介绍了如何使用R语言的Hmisc和igraph包计算微生物丰度与代谢物鉴定的相关性,生成graphml文件,然后通过Gephi软件进行可视化的过程。作者详细描述了数据准备、相关性计算和网络图的创建步骤。

1万+

被折叠的 条评论
为什么被折叠?



