一.安装和加载R包
1.镜像设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
2.安装R包
R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)。
3.加载
library(“包”)
二.dplyr五个基础函数
1.mutate(),新增列

2.select(),按列筛选
(1)按列号筛选

(2)按列名筛选

3.filter()筛选行

4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序
arrange(test, desc(Sepal.Length))#用desc从大到小
5.summarise():汇总

三.dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M)

2:count统计某列的unique值
count(test,Species)
四.dplyr处理关系数据
1.inner函数连接两个表
内连接 inner_join
左连接left_join
全连接 full_join
半连接:返回能够与y表匹配的x表所有记录semi_join
反连接:返回无法与y表匹配的x表的所记录anti_join
简单合并:在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
本文介绍了如何在R中安装和加载R包,重点讲解了dplyr库的五个基础函数(mutate、select、filter、arrange和summarise),以及两个实用技巧,包括管道操作和计数功能。此外,还涉及了处理关系数据的不同连接方法,如内连接、左连接、全连接、半连接和反连接。

145

被折叠的 条评论
为什么被折叠?



