一、范数的定义
范数是用来衡量向量大小的函数,记作LpL^pLp,定义为:
∣∣x∣∣p=(∑i∣xi∣p)1p||x||_p=(\sum_{i}|x_i|^p)^{\frac{1}{p}}∣∣x∣∣p=(i∑∣xi∣p)p1
其中,p∈Rp\in\mathbb{R}p∈R,p≥1p\geq1p≥1,这里的R\mathbb{R}R为实数集。
直观上来说,向量xxx的范数衡量从原点到点xxx的距离。
二、欧几里得范数
欧几里得范数是机器学习中出现较为频繁,它是当p=2p=2p=2时的特殊范数,即L2L^2L2,可以简化表示为∣∣x∣∣||x||∣∣x∣∣。它表示从原点到该向量的欧几里得距离。
我们有时候也会使用到平方L2L^2L2范数,可以简单理解为范数的平方,它在数学计算上面比L2L^2L2范数要方便得多。但是在某些情况下,由于平方L2L^2L2范数在原点附近增长缓慢,所以在某些有不同需求的模型中是不适用的。
除此之外,我们有时也会使用简单的L1L^1L1范数,即∣∣x∣∣1=∑i∣xi∣||x||_1=\sum_{i}|x_i|∣∣x∣∣1=∑i∣xi∣。每当向量xxx中的某个元素增加yyy时,整个范数也会增加yyy.
三、向量的大小和个数的理解
前面介绍到的范数指的是衡量一个向量的大小,如果我们要知道一个向量的非零元素个数,我们通常用L1L^1L1范数作为表示非零元素个数的替代函数,因为无论将LpL^pLp范数缩放多少倍,里面的非零元素的个数是不会变化的,它只会影响范数的大小,那么为什么用L1L^1L1范数呢?————因为简单方便啊哈哈哈哈哈!!!!
四、最大范数(max norm)
1、表示的是向量中具有最大幅值的元素的绝对值,尤其要注意它是向量中元素的绝对值,这个元素的幅值是最大的,也就是离远点是最远的,L∞L^\inftyL∞最大范数定义为:
∣∣x∣∣∞=maxi∣xi∣||x||_\infty=max_{i}|x_i|∣∣x∣∣∞=maxi∣xi∣
2、在深度学习中,我们也会使用FrebeniusFrebeniusFrebenius范数来衡量!矩阵!的大小,即:
∣A∣F=∑i,jAi,j2|A|_F=\sqrt{\sum_{i,j}A^2_{i,j}}∣A∣F=i,j∑Ai,j2
3、两个向量的点积使用范数来表示就是:
xTy=∣∣x∣∣2∣∣y∣∣2cosθx^Ty=||x||_2||y||_2\cos\thetaxTy=∣∣x∣∣2∣∣y∣∣2cosθ 其中,θ\thetaθ表示xxx和yyy之间的夹角。
本文介绍了机器学习中的范数概念,包括范数的定义、欧几里得范数(L2范数)、L1范数以及最大范数(L∞范数)。讨论了在深度学习中不同范数的应用,如L1范数用于衡量非零元素个数,最大范数表示向量中最大幅值元素,而弗雷本ius范数则用于衡量矩阵大小。

487

被折叠的 条评论
为什么被折叠?



