SeoulBikeData.csv 数据分析作业

本文使用SeoulBikeData.csv数据集进行自行车租赁需求分析,通过线性回归探讨温度、湿度等因素对租赁数量的影响。数据集包括5796个观测值,平均每小时租用量705辆,最高达3556辆。相关性研究表明,温度与租车数量关系最为密切。文章将采用OLS和LASSO方法建立模型,并可能涉及训练集和测试集的划分以评估模型性能。

当前,在许多城市中引入了租赁自行车以增强移动舒适性。重要的是要在适当的时间向公众提供和出租自行车,因为这样可以减少等待时间。但是,为城市提供稳定的租赁自行车供应成为一个主要问题。关键部分是要预测稳定租用自行车每小时所需的自行车数量。利用以下数据对Rented Bike count指标进行线性回归。
数据集包含天气信息(温度,湿度,风速,能见度,露点,太阳辐射,降雪,降雨),每小时租用的自行车数量和日期信息。

要求:

  1. 了解数据集基本信息,并进行一些基本的描述性分析;
data = read.csv("SeoulBikeData.csv")
str(data)

数据集中一共有5796个数据

library(tidyverse)
summary(data$Rented.Bike.Count)

每小时租用的自行车数平均数是705, 中位数是504,最大值是3556

number_data = data %>% select(where(is.numeric))

library(ggcorrplot)
number_data %>%
  cor() %>%
  round(2) %>%
  ggcorrplot(hc.order = TRUE,lab = TRUE)

首尔自行车数据分析 R中首尔共享单车需求数据集的回归分析 • 执行模型分析以预测每小时所需的自行车数量,以确保租赁自行车的稳定供应 • 使用 R、机器学习和统计建模技术 导言:数据集的背景/动机 目前,许多主要城市都引入了租赁自行车,以提高机动性、舒适性和环保交通。重要的是要让公众在适当的时候可以使用和使用租赁自行车,因为这可以缩短等待时间。最终,为城市提供稳定的租赁自行车供应是一个主要问题。有许多因素,如温度、一天中的时间、假期、季节等,可能会影响自行车的可用性。关键部分是预测每小时所需的自行车数量,以稳定租赁自行车的供应。 使用天气数据[1]的首尔自行车共享需求预测的基于规则的模型使用了两个数据集——首尔自行车和首都自行车共享计划。它给出了5个统计模型的结果,这些模型使用重复交叉验证方法用优化的超参数进行训练,并使用测试集进行评估:(a)立方体(b)正则化随机森林(c)分类和回归树(d)K近邻(e)条件推理树。使用R2、均方根误差、平均绝对误差和变异系数等多重评估指标来衡量回归模型的预测性能。结果表明,基于规则的CUBIST模型能够解释汉城自行车测试集中约95%的方差(R2)。对所有开发的模型进行了变量重要性分析,以分析最重要的变量。这些模型表明,温度和一天中的小时数是小时租赁自行车需求预测中最有影响的变量。 Cubist模型是在Quinlan的M5模型树的基础上引入的,该模型树创建了一系列“if-after-after”规则,其中每个规则都有一个相关的线性多元模型。立体主义模型的好处在于,它是一种可行的回归方法,可以应用于各种问题。 在预测自行车共享需求的回归模型[2]中,他们对汉城自行车数据集应用了回归模型,得出的值为0.567,表明线性回归能够确定56.7%的自行车租赁数量变化。研究论文指出,低R平方值的回归模型可能是非常好的模型,原因有几个,因为某些研究领域存在大量无法解释的内在差异。在这些区域,R2值必然较低。 如果一个人的R平方值较低,但自变量在统计上具有显著性,那么仍然可以得出关于变量之间关系的重要结论。正如本文所观察到的,0.56是一个相对较低的值,但统计显著性有助于更好地了解影响自行车租赁数量的因素。从数据集中提取更好的结果和模式的进一步范围包括实现高级算法,如分类树、随机森林、K近邻。 在这个项目中,我们的目标是使用统计数据来确定哪些因素导致每小时租赁自行车的最佳供应。例如,如果温度太高,能见度差,我们将供应少量的自行车,因为需求会减少。如果我们的模型成功,它将允许自行车所有者和管理者决定在任何给定时间租用的自行车数量。自行车使用者也将体验到友好舒适的服务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值