基于R和gephi做宏基因组与代谢组等多组学联合network相关性网络图

原创

已于 2023-10-12 09:38:20 修改 · 6.6k 阅读

标签

#r语言 #开发语言

于 2023-10-12 09:34:48 首次发布

本文介绍了如何使用R语言的Hmisc和igraph包计算微生物丰度与代谢物鉴定的相关性，生成graphml文件，然后通过Gephi软件进行可视化的过程。作者详细描述了数据准备、相关性计算和网络图的创建步骤。

写在前面

拿到多组学的数据后一直在找合适的方法将二者进行关联，比如我这里是三种体液的代谢组与一种体液的宏基因组。需求是对多组学进行关联分析，直到最近看到不少文章里利用Gephi将相关性表格进行可视化的图，效果还不错，于是写个过程记录自用。这里演示的是属水平的差异菌群相对丰度（宏基因组结果）与代谢组鉴定到的差异代谢物进行关联。

主要分为两个部分：

先是计算相关性生成graphml格式文件
使用Gephi软件进行可视化

数据准备

主要就是两个需要关联的表格

差异代谢物表格
差异菌属的相对丰度表格

这里注意：原文件如果是新建的excel，默认有3个sheet，一定记得只保留一个sheet后另存为制表符分隔的txt文件，这一点很重要，不然下面分析的时候会从读取就开始报错！

R包Hmisc计算相关性并用igraph包生成graphml

用到Hmisc包和igraph包

这里就直接放代码吧，遇到相关的报错先仔细检查数据，一般是数据格式和内容本身的问题。不行就上网找解决办法。

###微生物和代谢物的相关性网络
##计算微生物类群丰度和代谢物鉴定强度的相关系数
setwd('F:\\Analysis\\RA_Sanhe cow\\Microgenome\\Network_Gephi module_Pretreat\\RE group\\M_metabolites_genus')
library(Hmisc)
MAG <- read.delim('differ_genus.txt',row.name = 1, check.names = FALSE)
Enzyme <- read.delim('milk_differ_metabolites_inform.txt',row.name = 1, check.names = FALSE)
MAG

最低0.47元/天解锁文章