机器学习数学基础之范数

本文介绍了机器学习中的范数概念,包括范数的定义、欧几里得范数(L2范数)、L1范数以及最大范数(L∞范数)。讨论了在深度学习中不同范数的应用,如L1范数用于衡量非零元素个数,最大范数表示向量中最大幅值元素,而弗雷本ius范数则用于衡量矩阵大小。

一、范数的定义

范数是用来衡量向量大小的函数,记作LpL^pLp,定义为:
∣∣x∣∣p=(∑i∣xi∣p)1p||x||_p=(\sum_{i}|x_i|^p)^{\frac{1}{p}}xp=(ixip)p1
其中,p∈Rp\in\mathbb{R}pRp≥1p\geq1p1,这里的R\mathbb{R}R为实数集。
直观上来说,向量xxx的范数衡量从原点到点xxx的距离。

二、欧几里得范数

欧几里得范数是机器学习中出现较为频繁,它是当p=2p=2p=2时的特殊范数,即L2L^2L2,可以简化表示为∣∣x∣∣||x||x。它表示从原点到该向量的欧几里得距离。

我们有时候也会使用到平方L2L^2L2范数,可以简单理解为范数的平方,它在数学计算上面比L2L^2L2范数要方便得多。但是在某些情况下,由于平方L2L^2L2范数在原点附近增长缓慢,所以在某些有不同需求的模型中是不适用的。

除此之外,我们有时也会使用简单的L1L^1L1范数,即∣∣x∣∣1=∑i∣xi∣||x||_1=\sum_{i}|x_i|x1=ixi。每当向量xxx中的某个元素增加yyy时,整个范数也会增加yyy.

三、向量的大小和个数的理解

前面介绍到的范数指的是衡量一个向量的大小,如果我们要知道一个向量的非零元素个数,我们通常用L1L^1L1范数作为表示非零元素个数的替代函数,因为无论将LpL^pLp范数缩放多少倍,里面的非零元素的个数是不会变化的,它只会影响范数的大小,那么为什么用L1L^1L1范数呢?————因为简单方便啊哈哈哈哈哈!!!!

四、最大范数(max norm)

1、表示的是向量中具有最大幅值的元素的绝对值,尤其要注意它是向量中元素的绝对值,这个元素的幅值是最大的,也就是离远点是最远的,L∞L^\inftyL最大范数定义为:
∣∣x∣∣∞=maxi∣xi∣||x||_\infty=max_{i}|x_i|x=maxixi

2、在深度学习中,我们也会使用FrebeniusFrebeniusFrebenius范数来衡量!矩阵!的大小,即:
∣A∣F=∑i,jAi,j2|A|_F=\sqrt{\sum_{i,j}A^2_{i,j}}AF=i,jAi,j2

3、两个向量的点积使用范数来表示就是:
xTy=∣∣x∣∣2∣∣y∣∣2cos⁡θx^Ty=||x||_2||y||_2\cos\thetaxTy=x2y2cosθ 其中,θ\thetaθ表示xxxyyy之间的夹角。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值