sklearn-最小二乘线性回归

最新推荐文章于 2026-05-23 22:10:48 发布

原创

最新推荐文章于 2026-05-23 22:10:48 发布 · 4.1k 阅读

收录于

本文介绍了如何利用sklearn库进行最小二乘线性回归。通过加载数据集，划分训练集和测试集，然后使用linear_model中的fit方法进行模型拟合，predict方法进行预测，score方法评估模型性能。sklearn还提供了coef_和intercept_属性获取回归方程，并且包含了丰富的数据预处理和误差验证功能。

sklearn是机器学习中的一个常用的python第三方模块，里面对机器学习的许多方法进行了封装，在进行机器学习的任务时，许多常用的算法可在这个模块中直接调用。并且sklearn中还提供了许多可用于分类、回归的优质数据集。使用好sklearn最直接的方法就是仔细阅读官方http://scikitlearn.org/stable/index.html

sklearn就像是一个模板库，是许多机器学习框架中的基础

首先import datasets在sklearn中加载你需要的数据集

from sklearn import datasets     #从sklearn中导入其自带的优质数据集
import numpy as np
import matplotlib.pyplot as plt
'''
例如：
iris=datasets.load_iris()        #使用其中的鸢尾花数据集（分类）
X=iris.data      #得到数据的特征集，该数据集有四个特征：花萼长、宽和花瓣长、宽
Y=iris.target    #该数据的标签集
'''
boston=datasets.load_boston()    #波士顿房价数据集（506*13，回归）
#print boston.DESCR              #可以查看sklearn数据集的一些属性
X=boston.data                    #数据有506条，每条数据有十三个特征和一个真实值
Y=boston.target

自己可以将得到的数据集手动划分得到需要的训练集和测试集

sampleRatio=0.5               #划分训练集和测试集各一半
m=len(X)
sampleBoundary=int(m*sampleRatio)
myshuffle=list(range(m))      #注意Python3中

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Witness2020

关注关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

偏最小二乘判别PLS-DA的python实现（基于sklearn，附完整代码实现）

ajiujiujiu的博客

05-22

9454

PLS-DA的sklearn实例前两天收到了论文的拒稿意见，其中一条是“PLSDA的表示错误，应为PLS-DA”，好吧，以后都写PLS-DA！虚心接受专家意见。由于之前偷懒，都是用PLS toolbox完成相关偏最小二乘法的数据分析工作，借此机会，就把PLS-DA的python实现好好唠唠。查过不少资料中，没有详细说调包sklearn实现的，废话不多说，进入正题。 sklearn中的偏最小二乘函数为PLSRegression()，这是一个回归函数，如果直接拿来做分类，显然得不到想要的结果。调用格式如下：

参与评论您还未登录，请先登录后发表或查看评论

Sklearn实现普通最小二乘法

我的博客

01-11

1780

LinearRegression拟合一个带有系数w=(w1,...,wp)w=(w_1,...,w_p)w=(w1,...,wp)的线性模型，使得数据集实际观测数据和预测数据之间的残差平方和最小，其数学表达式为： minw∣∣Xw−y∣∣22min_w||Xw-y||^2_2minw∣∣Xw−y∣∣22 LinearRegression 会调用 fit 方法来拟合数组 X， y，并且将线性模型的系数 w 存储在其成员变量 coef_ 中: >>> from sklearn.lin

[python] Sklearn（一）之最小二乘法

静以修身，简以养德

08-23

3019

最小二乘法是一个很实用的工具，它的概念很容易理解，但用程序实现几个矩阵乘法有可能很容易搞错了，但是会python就啥都会了，难道不是么。废话不多说，上代码一、基础版的最小二乘法demo from sklearn import linear_model reg = linear_model.LinearRegression() #reg.fit([(0,0),(1,1),(2,2)],[0,1,2])#拟合，写法1 X=[(0,0),(1,1),(2,2)] Y=[0,1,2] reg.fit(X,Y)#

线性回归 最小二乘法

最新发布

m0_62318828的博客

05-23

219

线性回归的最小二乘法，是一种通过最小化预测误差的平方和，来找到数据最佳拟合直线的标准方法。简单而言，找到所有数据点距离直线的距离平方和最小。但同时也存在缺点：对异常值很敏感（异常值会导致直线变化），与此同时，一般数据的关系不会是简单的线性关系，涵盖面较低。最小二乘法的线性回归优点在于形式简单，计算快，同时因为没有超参数，易于解释。其中，y^表示预测值，w为斜率，b为截距。对于有截距和无截距的情况，一般而言都需考虑有截距的情况！结果而言，推测的数据更加波动。

【sklearn】线性回归、最小二乘法、岭回归、Lasso回归

📷 图像处理践行者 | 传统算法 · 深度学习 · 多模态 | 分享实战经验与技术洞见，探索从像素到智能的无限可能。

11-13

8977

scikit-learn（sklearn）是基于Python的机器学习库，建立在NumPy、SciPy等科学计算库之上，提供简洁的API接口，适合机器学习初学者。sklearn包含六大任务模块（分类、回归、聚类、降维、模型选择、预处理）和数据集模块（datasets）。

关于重温机器学习笔记-线性模型

不胜人生一场醉

02-14

1163

由于高等数学底子太差的原因，机器学习总是无法深入学习下去，只能做一个简单的尝试者，甚至连调优也未必能算的上，不过这样也好，可以把重心放到对业务的理解上，以及业务和模型的选择上。线性模型包括了传统的线性回归、岭回归、Lasso回归，主要用于连续值的预测；逻辑回归虽然也是回归，但却是一种分类方法；LDA线性判别分析，则是一种降维方法；多项式回归，是使用线性模型训练数据的非线性函数。总的来说，...

【从零开始学习sklearn——最小二乘法】

2402_83272769的博客

11-03

910

本文介绍了线性模型LinearRegression模型，通过不断迭代优化ω参数来缩小X和Y之间的误差

python 数据处理专题(第 10天：sklearn学习（三）)

m0_55951714的博客

12-15

841

线性回归是统计学中的一种基本算法，用于建立一个或多个自变量（解释变量）与一个因变量（响应变量）之间的线性关系模型。在机器学习库scikit-learn（简称sklearn）中，线性回归算法被实现为LinearRegression类，用于预测连续的数值型目标变量。sklearn中的线性回归基于最小二乘法，通过最小化残差平方和来估计模型参数。这种方法简单、高效，适用于各种线性关系建模的场景。然而，它也有一些局限性，比如对异常值敏感，以及假设误差项独立同分布等。

线性回归最小二乘法计算步骤以及sklearn参数介绍

h2728677716的博客

03-30

4477

介绍 线性回归是特征与标签之间建立一个关系来描绘特征和标签之间的关系。预测函数的本质就是我们构建的模型，而构造的函数核心就是找出模型的参数向量w 最小二乘法（解析解）求解W 通过已知的MSE损失函数，推导出来线性回归解析解求解公式先将损失函数换一个写法（表达形式），写成线性代数的表达形式。 2. 对表达式进行推导梯度：某个点上切线的斜率叫做梯度（对某个驻点求一阶导就是切线的斜率）（不管是全局最优解还是局部最优解，切线斜率为零的地方就是最优解）那么我们就设置上式导函数

深度学习03-sklearn.LinearRegression 源码学习

weixin_48967543的博客

04-29

575

在上次的代码重写中使用了sklearn.LinearRegression 类进行了线性回归之后猜测其使用的是常用的梯度下降+反向传播算法实现，所以今天来学习它的源码实现。但是在看到源码的一瞬间突然有种怀疑人生的感觉，我是谁？我在哪？果然大佬的代码只能让我膜拜。在一目十行地看完代码之后，我发现了一个问题，梯度的单词是gradient，一般在代码中会使用缩写grad 来表示梯度，而在这个代码中除了Gram 之外竟然没有一个以'g' 开头的单词，更不用说gradient 了。那么代码中包括注释压根没提到过梯度.

python sklearn 线性回归 报错_(转)Python- sklearn之最小二乘法

weixin_26741799的博客

02-19

400

1.背景:1801年，意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后，由于谷神星运行至太阳背后，使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星，但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希·奥伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯使用的最小二乘法的方法发表于...

sklearn库求解线性回归最小二乘法实例代码（Python，附数据集下载）

画地为牢的博客

06-27

1340

代码实现： # 调库求解线性回归最小二乘法 # 0. 引入依赖 import numpy as np import matplotlib.pyplot as plt # 1. 导入数据 points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',') points[0, 0] # 提取points中的两列数据，分别作为x，y x = points[:, 0] y = points[:, 1] # 用plt

梯度下降法求解线性回归

coffeetogether的博客

06-22

8889

梯度下降法求解线性回归 通过梯度下降法求解简单的一元线性回归 分别通过梯度下降算法和sklearn的线性回归模型（即基于最小二乘法）解决简单的一元线性回归实际案例，通过结果对比两个算法的优缺。通过最小二乘法解决一元线性回归可以参考下面文章 https://blog.csdn.net/coffeetogether/article/details/118114217 数据源：链接: https://pan.baidu.com/s/1KVw_9O5o9vqQnpgRNfLGVQ 提取码：8u8e 一、梯度下降

最小二乘法线性回归、sklearn.linear_model.LinearRegression

qq_44099721的博客

01-12

1130

最小二乘法线性回归：sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False,copy_X=True, n_jobs=1) 主要参数说明： fit_intercept(添加截距)：布尔型，默认为True，若参数值为True时，代表训练模型需要加一个截距项b；若参数为False时，代表模型无需加截距项。 nor...

机器学习（3）线性回归sklearn.linear_model.LinearRegression

voidfaceless的博客

03-10

3708

sklearn.linear_model.LinearRegression class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1) 普通最小二乘线性回归 参数： fit_intercept: 布尔型，默认为tru

[机器学习]简单线性回归——最小二乘法

啦啦啦

01-28

834

【代码】[机器学习]简单线性回归——最小二乘法。

scikit-learn：回归分析——多元线性回归LinearRegression

错位的梦寐的博客

09-30

8528

回归分析整体逻辑回归分析（Regression Analysis）研究自变量与因变量之间关系形式的分析方法，它主要是通过建立因变量y与影响它的自变量 x_i(i=1,2,3… …)之间的回归模型，来预测因变量y的发展趋向。回归分析的分类 线性回归分析 - 简单线性回归 - 多重线性回归 非线性回归分析 - 逻辑回归 - 神经网络回归分析的步骤根据预测目标，确定自变量和因变量绘制散...

【机器学习】使用线性回归模型预测房屋价格

qbx的博客

03-27

4072

在sklearn中，既可以使用LinearRegression实现基于最小二乘法的线性回归，也可以使用随机梯度下降模型SGDRegressor实现基于梯度下降法的线性回归。

机器学习sklearn线性回归

shellquery的博客

03-14

115

回归算法是机器学习的一个基础算法，简单的就是线性回归，还有非线性回归。本节我们讲解简单的线性回归。线性回归就是用直线来描述两个变量之间的线性关系。我们在中学时可以根据平面...

最小二乘法，梯度下降法，sklearn中API来实现线性回归

weixin_46700209的博客

01-24

1472

导入模块 import numpy as np import pandas as pd from matplotlib import pyplot as plt 1.导入训练集数据 x = np.array([0.86, 0.96, 1.12, 1.35, 1.55, 1.63, 1.71, 1.78]) y = np.array([12, 15, 20, 35, 48, 51, 59, 66]) def fit(x,y): if len(x) != len(y): retu.