数据文件 Insurance csv包含1338条观测,即目前已经登记过的保险计划受益者以及表示病人特点和历年计划入的总的医疗费用的特征。这些特征是

最新推荐文章于 2025-06-11 23:20:46 发布

原创最新推荐文章于 2025-06-11 23:20:46 发布 · 1.1k 阅读

·

2

·

标签

#回归 #机器学习 #数据挖掘

R语言大学作业专栏收录该内容

该专栏为热销专栏榜第48名

1436 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

博客探讨了Insurance csv数据集，包含1338个保险计划受益者的年龄、性别、BMI、孩子数量、吸烟状况、居住地区和医疗费用等特征。文章通过线性回归、决策树、随机森林和SVM四种回归方法预测医疗费用，并使用RMSE评估模型性能。结果显示，随机森林回归在预测误差上表现最佳。

数据文件 Insurance csv包含1338条观测,即目前已经登记过的保险计划受益者以及表示病人特点和历年计划入的总的医疗费用的特征。这些特征是

Age.表示主要受益者的年龄
Sex:性别sex=1,表示男性;sex=0表示女性
Bmi:身体质量指数,BMI指数等于体重(公斤)除以身高(米)的平方。理想的BM指数在18.5-24.9
Children:整数,表示保险计划中所包括的孩子受抚养者的数量
Smoker:是否吸烟, smoker=1表示吸烟, smoker=0表示不吸烟
Region:四个居任地,1,2,3,4
Charges:已结算的医疗费用如何将这些变量与已结算的医疗费用联系在一起是非常重较的。
结合本学期所学的回归预测方法,建立这些变量与 Charges的关系,并说明为什么选择该模型,并从预测误差角度说明该型的好坏。

data <- read.csv("insurance.csv")

选择的回归方法：线性回归，决策树回归，随机森林回归，SVM 回归，然后通过比较RMSE来判断模型的好坏

划分训练集和测试集

index

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mrrunsen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。