R语言数据统计分析与机器学习常用包

1: 数据读写与预处理包

readr:该包能够提供快速友好的方式来读取规则的数据结构(如'csv','tsv'和'fwf')。

readxl:该包能够方便的读取Excel格式的数据。

foreign:该包能够读取和写入其它统计分析软件的数据格式,如:“Minitab”、“S”、“SAS”、“SPSS”、“Stata”、“Weka”等统计分析软件。

haven:该包能够导入和导出“SPSS”、“Stata”和“SAS”等统计分析软件的文件。

R.matlab:该包可以读写MAT文件并从R内部调用MATLAB。

imager:该包提供了众多传统的图像处理函数(过滤、形态、转换等),能够让R轻松分析图像数据。

VIM:该包提供多种可视化数据缺失值的方式,以及多种填补数据缺失值的方法。

Hmisc:该包含有许多数据分析、高级可视化图像、变量聚类、数据表处理等分析方法的函数。

mice:该包提供缺失值多重插补的函数。

dplyr:该包提供处理数据的快速、一致的解决方法,常用于数据框等对象,主要用来数据清洗和整理。

tidyr:该包专门为数据整理而设计,常和dplyr包一起使用。

stringr:该包包含多种字符串处理的函数,非常方便。

2: 统计分析

MVN:该包含单变量和多变量正态性检验的方法。

psych:该包是心理测量理论和实验心理学的通用工具箱,主要用于因子分析、主成分分析、聚类分析和可靠性分析等模型的构建,同时还提供了基本的描述性统计功能。

vcd:该包主要用于分类数据的可视化与分析。

car:该包含有一些分析方法函数,常与回归分析的相关包一起使用。

glmnet:该包提供Lasso、弹性网等广义线性回归模型的函数。

cluster:R中常用的聚类分析包。

fpc:灵活的聚类分析包,提供多种聚类分析方法的函数和可视化方法,如DBSCAN聚类等。

ca:常用于对应分析及其可视化。

CCA:典型相关分析包。

candisc:可视化广义典型判别和典型相关分析的包。

arules:常用于频繁项集和关联规则分析的包。

arulesViz:该包常用于可视化arules包得到的关联规则等。

tseries:时间序列分析及计算金融包。

zoo:该包定义了一个名为zoo的S3类型对象,用于描述规则和不规则的有序时间序列数据,是常用的时间序列分析包。

forecast:时间序列和线性模型的预测函数,常用于ARIMA等时间序列模型

3: 机器学习

caret:主要用于训练和可视化回归模型和分类模型的包。

Metrics:该包主要用于方法性能的评估和度量,通常用于监督机器学习的性能,它实现了回归、时间序列、二分类、多分类和信息检索等问题的性能度量。

ROCR:用于可视化和评估分类器性能的包,如可视化ROC曲线等。

rpart:包含决策树分类、回归和生存分析等方法。

rpart.plot:该包主要用于将rpart包得到的决策树等结果进行可视化。

randomForest:使用随机森林进行分类和回归分析的包。

tm:该包提供了文本挖掘中的综合处理功能,如:数据载入、语料库处理、数据预处理、元数据管理以及建立“文档-词项”矩阵等。

jiebaR:该包主要用于中文分词,以及建立“文档-词项”矩阵等。常用于中文文本挖掘的数据预处理阶段。

parallel:在R中提供并行计算的包。

lda:该包主要实现了LDA主题模型及其相关模型。

LDAvis:该包主要是将lda包得到的主题模型可视化为可交互式图像。

text2vec:该包是快速且内存友好的文本分析工具,用于文本向量化,主题建模(LDA、LSA),单词嵌入等模型的应用。

e1071:该包是包含众多算法的机器学习包,如支持向量机、聚类分析、朴素贝叶斯等。

DMwR:包含有使用R进行数据挖掘的众多数据和函数。

RSNNS斯图加特神经网络模拟器(SNNS)是一个包含许多神经网络标准实现的库,RSNNS包装了SNNS功能,使其可以在R内部使用。

neuralnet:该包是常用的神经网络模型分析包,实现了多种网络结构的神经网络模型,使用时非常方便。

NeuralNetTools:该包主要是用于将neuralnet包得到的结果进行可视化等。

h2o:该包是可扩展的开源机器学习平台,提供许多有监督和无监督机器学习算法的并行实现,如广义线性模型,梯度提升机,随机森林,深度神经网络(深度学习)等。

keras:非常简单易用的深度学习包,它能够以TensorFlow等深度学习框架作为后端运行,提供高级神经网络API。

上面介绍的R语言统计分析与机器学习的内容均参考自书籍《R语言统计分析与机器学习》——薛震,孙玉林,著。学习更多的关于R语言机器学习的内容。书籍QQ交流群(617493715),欢迎大家的加入相互交流学习。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值