机器学习数学基础之范数

最新推荐文章于 2025-03-21 14:42:36 发布

原创最新推荐文章于 2025-03-21 14:42:36 发布 · 1k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#机器学习 #python #深度学习

我的Python学习笔记专栏收录该内容

7 篇文章

订阅专栏

本文介绍了机器学习中的范数概念，包括范数的定义、欧几里得范数（L2范数）、L1范数以及最大范数（L∞范数）。讨论了在深度学习中不同范数的应用，如L1范数用于衡量非零元素个数，最大范数表示向量中最大幅值元素，而弗雷本ius范数则用于衡量矩阵大小。

一、范数的定义

范数是用来衡量向量大小的函数，记作 $L^p$ ，定义为：
$∣∣x∣∣p=(∑i∣xi∣p)1p||x||_p=(\sum_{i}|x_i|^p)^{\frac{1}{p}}$
其中， $p∈Rp\in\mathbb{R}$ ， $p≥1p\geq1$ ，这里的 $R\mathbb{R}$ 为实数集。
直观上来说，向量 $x$ 的范数衡量从原点到点 $x$ 的距离。

二、欧几里得范数

欧几里得范数是机器学习中出现较为频繁，它是当 $p = 2$ 时的特殊范数，即 $L^2$ ，可以简化表示为 $∣ ∣ x ∣ ∣$ 。它表示从原点到该向量的欧几里得距离。

我们有时候也会使用到平方 $L^2$ 范数，可以简单理解为范数的平方，它在数学计算上面比 $L^2$ 范数要方便得多。但是在某些情况下，由于平方 $L^2$ 范数在原点附近增长缓慢，所以在某些有不同需求的模型中是不适用的。

除此之外，我们有时也会使用简单的 $L^1$ 范数，即 $∣∣x∣∣1=∑i∣xi∣||x||_1=\sum_{i}|x_i|$ 。每当向量 $x$ 中的某个元素增加 $y$ 时，整个范数也会增加 $y$ .

三、向量的大小和个数的理解

前面介绍到的范数指的是衡量一个向量的大小，如果我们要知道一个向量的非零元素个数，我们通常用 $L^1$ 范数作为表示非零元素个数的替代函数，因为无论将 $L^p$ 范数缩放多少倍，里面的非零元素的个数是不会变化的，它只会影响范数的大小，那么为什么用 $L^1$ 范数呢？————因为简单方便啊哈哈哈哈哈！！！！