机器学习——降维算法PCA和SVD（sklearn）

最新推荐文章于 2026-03-31 10:23:13 发布

原创

最新推荐文章于 2026-03-31 10:23:13 发布 · 1.9k 阅读

·

31

·

标签

#人工智能 #机器学习 #算法 #sklearn #PCA

目录

一、基础认识

2. 认识 “ 维度 ”

（1）数组和Series

（2）DataFrame 表

3. 降维思想

4. 降维步骤

二、降维算法（PCA）

（1）PCA参数

（2）PCA属性

（3）PCA接口

2. PCA中的SVD

3. 训练流程

三、学习中产生的疑问，及文心一言回答

1. PCA中的components_属性

一、基础认识

1. 介绍

与特征选择类似，我们可以 用不同的特征提取技术来减少数据集的特征数量。特征选择和特征提取的区别在于，当我们用诸如逆序选择之类的特征选择算法时，数据集的原始特征保持不变，而当我们用特征提取方法时，会将数据变换或投影到新特征空间。在降维的背景下，我们可以把特征提取理解为数据压缩的一种方法，其目的是保持大部分的相关信息。

在实际应用中，特征提取不仅可以优化存储空间或机器学习算法的计算效率，而且还可以通过减少维数提高预测性能，尤其是当我们处理非正则化模型的时候。

2. 认识 “ 维度 ”

（1）数组和Series

对于数组和 Series来说，维度就是功能shape返回的结果，shape中返回了几个数字，就是几维。

（2）DataFrame 表

数组中的每一张表，都可以是一个特征矩阵或一个 DataFrame，表中行是样本，列是特征。针对每一张表，维度指的是样本的数量或特征的数量，一般无特别说明，指的都是特征的数量。除了索引之外，一个特征是一维，两个特征是二维，n 个特征是 n维。

（3）图像

对图像来说，维度就是图像中特征向量的数量。特征向量可以理解为是坐标轴，一个特征向量定义一条直线，是一维，两个相互垂直的特征向量定义一个平面，即一个直角坐标系，就是二维，三个相互垂直的特征向量定义一个空间，即一个立体直角坐标系，就是三维。三个以上的特征向量相互垂直，定义人眼无法看见，也无法想象的高维空间。

降维算法中的 “ 降维 ”，指的是降低特征矩阵中特征的数量。

3. 降维思想

在降维过程中，我们会减少特征的数量，这意味着删除数据，数据量变少

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。