机器学习——马氏距离

最新推荐文章于 2026-03-08 02:47:43 发布

原创

最新推荐文章于 2026-03-08 02:47:43 发布 · 1.7k 阅读

·

0

·

标签

#机器学习 #概率论 #矩阵

本文详细介绍了马氏距离的概念及其推导过程，强调了它作为欧式距离修正版的重要性，尤其是在处理多维数据时能考虑变量间的相关性和尺度问题。通过协方差矩阵的特征分解，展示了马氏距离如何计算，并解释了其在数据相似度分析中的应用。

机器学习——马氏距离

前言
马氏距离
马氏距离的推导

前言

在介绍马氏距离之前，我们首先看如下概念：

方差：方差是标准差的平方，而标准差的意义是数据集中各个点到均值点距离的平均值。反应的是数据的离散程度
协方差：标准差与方差是描述一维数据的，当存在多维数据时，我们通常需要知道每个维数的变量中间是否存在关联。**协方差就是衡量多维数据集中，变量之间相关性的统计量。**比如说，一个人的身高与他的体重的关系，这就需要用协方差来衡量。如果两个变量之间的协方差为正值，则这两个变量之间存在正相关，若为负值，则为负相关。
协方差矩阵：当变量多了，超过两个变量了。那么，就用协方差矩阵来衡量这么多变量之间的相关性。假设X是以n个随机变数组成的列向量：
$X=\left[{\begin{array}{l}X_1\\X_2\\...\\X_n\end{array}}\right]$
其中， $\mu_i$ 是第i个元素的期望值，即 $\mu_i=E(X_i)$ 。协方差矩阵 $\Sigma$ 的第i,j项被定义为如下形式：
$\sum_{ij}=cov(X_i,X_j)=E[(X_i-\mu_i)(X_j-\mu_j)]$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。