13、基于树的机器学习方法:随机森林与广义提升回归建模

基于树的机器学习方法:随机森林与广义提升回归建模

1. 随机森林(RF)
1.1 变量选择与模型准确性评估

不同的变量选择方法会产生不同的预测变量集,进而影响随机森林模型的预测准确性。可以使用 spm 包中的 RFcv 函数,通过交叉验证的方法对模型进行评估。 RFcv 函数关键参数如下:
- trainx :包含预测变量列的数据框或矩阵。
- trainy :响应变量的向量,长度必须等于 trainx 的行数。
- cv.fold :交叉验证的折数。
- predacc :预测准确性的度量方式,可选“VEcv”或“ALL”。

以下是几种变量选择方法对应的随机森林模型准确性评估的R代码:

# 1. Boruta方法
# 数值数据
library(Boruta)
set.seed(1234)
n <- 100
VEcv.b <- NULL
for (i in 1:n) {
  rfcv1 <- RFcv(sponge2[, getSelectedAttributes(sponge.bor)], sponge2[, 3],
                predacc = "VEcv")
  VEcv.b[i] <- rfcv1
}
# 分类数据
library(Boruta)
set.seed(1234)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值