读文献先读图:UpSet图怎么看?

定义

UpSet图是一种多集合交叉关系可视化工具,通过「点阵图+柱状图」的组合,直观展示多组数据的共有元素数量、分布规律及特征关联性,常用于展现基因组学,转录组学,蛋白质组学、疾病等数据集合之间的交集关系。

怎么看?

1.下方的点阵图

每行代表一个疾病如图中的抑郁症、慢性肾病、糖尿病、高血压)。

每列代表一个疾病集合(这些疾病同时出现的情况)。

圆点表示该集合中包含的疾病。

2.上方的柱状图:

Y轴: 代表了交集中同时患这些疾病样本数

柱状体:柱子代表该集合大小与下方的点阵图纵向对应)。柱子越高,代表该集合越大(患者越多)

3.左下角的边柱状图

X轴:代表至少患有一种疾病的人数比如所有抑郁症患者的总数,无论他们是否还有其他疾病)。

Y轴: 对应点阵图中的每一行(即每一个单独的疾病)。

柱状体:柱子的长度代表该疾病患者数量,柱子越长,表示患有该疾病的患者总数越大。

用途

相比于韦恩图,UPSET图可以更精确地展示多个集合复杂交集关系3个以上集合),可以用来展示基因/蛋白在不同功能通路或疾病中的重叠,也可用于临床共病研究

代码

# 代码来源:https://www.r2omics.cn/
# 加载R包,没有安装请先安装  install.packages("包名") 
library(UpSetR)         

# 读取数据文件
upset_dat <- read.delim('https://www.r2omics.cn/res/demodata/venn.txt') # 这里读取了网络上的demo数据,将此处换成你自己电脑里的文件
upset_list <- list(upset_dat[,1], upset_dat[,2], upset_dat[,3], upset_dat[,4], upset_dat[,5], upset_dat[,6], upset_dat[,7])   # 制作Upset图搜所需要的列表文件
names(upset_list) <- colnames(upset_dat[1:7])    # 把列名赋值给列表的key值
upset_list<- purrr::map(upset_list, na.omit)     # 删除列表中每个向量中的NA
upset_list<- purrr::map(upset_list, function(x){x[x!=""]}) # 删除列表中每个向量中的""

#作图
upset(fromList(upset_list),  # fromList一个函数,用于将列表转换为与UpSetR兼容的数据形式。
      nsets = 100,           # 绘制的最大集合个数
      nintersects = 40,      #绘制的最大交集个数,NA则全部绘制
      order.by = "freq",     # 矩阵中的交点是如何排列的。 "freq"根据交集个数排序,"degree"根据
      keep.order = F,        # 保持设置与使用sets参数输入的顺序一致。默认值是FALSE,它根据集合的大小排序。
      mb.ratio = c(0.6,0.4), # 左侧和上方条形图的比例关系
      text.scale = 1         # 文字标签的大小
)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值