kaggle大学之机器学习(灌水帖)

本文介绍了kaggle上的机器学习课程,通过实例讲解了模型运作原理、数据探索、建立首个模型、模型验证、过拟合与欠拟合的概念以及随机森林的应用。内容包括数据预处理、模型拟合、训练集验证集划分、平均绝对误差计算等。

kaggle真是一个好网站,这里的微课虽然内容非常少,但是却是有着学习加训练的闭环。每次学习都能从实际例子中让我真正学到东西。好了废话不多说,今天继续冲机器学习的微课。

sql已经学完了,sql提高不打算看,因为这些操作可以在更便捷的编程语言上学习到。机器学习入门看了一半,不过不理解数据使得我止步了。但是今天我要重返这里,征服机器学习的高峰。

机器学习搞完看pandas和数据可视化模块。

目录

一、模型是怎么运作的

二、基本数据探索EDA

三、你的第一个机器学习模型

选择数据:查看一下列名

发现预测目标存入变量 

选择我们所需要的特诊值

指定并拟合模型

四、模型验证

1、分离数据(训练集与验证集)

2、将训练集拟合入模型

3、使用验证数据进行预测 

计算平均绝对误差

五、过拟合和欠拟合

1、对比不同的决策树尺寸

2、 用所有的数据来拟合模型

六、随机森林

1、使用随机森林


一、模型是怎么运作的

话题:房价

最基本的思想,决策树根据房子是否有两个卧室来决定房子是否值更多的钱

再提高复杂度,如果一个房子有两个卧室,那么它的面积是否大于一定的值,来判断他是否值更细分区间的价钱。

二、基本数据探索EDA

先使用pandas熟悉一下数据,基本的导入数据然后预览字符格式,行列数,预览前5行都是基本操作了。

iowa_file_path = '../input/home-data-for-ml-course/train.csv'

home_data = pd.read_csv(iowa_file_path)

home_data.describe()

这里还是简单的写一下都已经懂了

三、你的第一个机器学习模型

1、选择数据

2、选择预测目标

3、选择特征

4、建立模型

开始实战

home_data.columns

选择数据:查看一下列名

Index(['Id', 'MSSubClass', 'MSZoning', 'LotFrontage', 'LotArea', 'Street',
       'Alley', 'LotShape', 'LandContour', 'Utilities', 'LotConfig',
       'LandSlope', 'Neighborhood', 'Condition1', 'Condition2', 'BldgType',
       'HouseStyle', 'OverallQual', 'OverallCond', 'YearBuilt', 'YearRemodAdd',
       'RoofStyle', 'RoofMatl', 'Exterior1st', 'Exterior2nd', 'MasVnrType',
       'MasVnrArea', 'ExterQual', 'ExterCond', 'Foundation', 'BsmtQual',
       'BsmtCond', 'BsmtExposure', 'BsmtFinType1', 'BsmtFinSF1',
       'BsmtFinType2', 'BsmtFinSF2', 'BsmtUnfSF', 'TotalBsmtSF', 'Heating',
       'HeatingQC', 'CentralAir', 'Electrical', '1stFlrSF', '2ndFlrSF',
       'LowQualFinSF', 'GrLivArea', 'BsmtFullBath', 'BsmtHalfBath', 'FullBath',
       'HalfBath', 'BedroomAbvGr', 'KitchenAbvGr', 'KitchenQual',
       'TotRmsAbvGrd', 'Functional', 'Fireplaces', 'FireplaceQu', 'GarageType',
       'GarageYrBlt', 'GarageFinish', 'GarageCars', 'GarageArea', 'GarageQual',
       'GarageCond', 'PavedDrive', 'WoodDeckSF', 'OpenPorchSF',
       'EnclosedPorch', '3SsnPorch', 'ScreenPorch', 'PoolArea', 'PoolQC',
       'Fence', 'MiscFeature', 'MiscVal', 'MoSold', 'YrSold', 'SaleType',
       'SaleCondition', 'SalePrice'],
      dtype='object')

其实有很多黑话,简写增加了阅读难度,在以后的步骤里,我会根据需要进行翻译。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值