数学狂想曲(二)——拉普拉斯变换, 随机变量的特征函数, 双曲函数和悬链线, 概率分布

本文介绍了拉普拉斯变换、傅里叶变换等数学变换的基本概念,以及这些变换与信号处理的关系。此外,还深入探讨了概率论中的核心概念,包括特征函数、贝塔分布、伽玛分布等,并讨论了这些分布之间的联系。

拉普拉斯变换

F(s)=0estf(t)dt,s=σ+iω

傅里叶变换的收敛有一个狄利克雷条件,要求信号绝对可积/绝对可和。

为了使不满足这一条件的信号,也能读出它的“频率”,可以采用拉普拉斯变换和Z变换。它们对“频率”的含义做出了扩充,使得大多数有用信号都具有了对应的“频率”域表达式。

拉普拉斯变换将频率从实数推广为复数,因而傅里叶变换变成了拉普拉斯变换的一个特例。当s为纯虚数时, x(t) 的拉普拉斯变换,即为 x(t) 的傅里叶变换。

从图像的角度来说,拉普拉斯变换得到的频谱是一个复平面上的函数。

这里写图片描述

而傅里叶变换得到的频谱,则是从虚轴上切一刀,得到的函数的剖面。

这里写图片描述

这里写图片描述

参考:

https://www.zhihu.com/question/22085329

随机变量的特征函数

特征函数是描述随机变量概率分布的重要工具,其定义如下。

设随机变量X的CDF为 FX(x) ,则其特征函数定义为:

φX(t)=E(eitX)=+eitxdFX(x)

其中, i=1 ,并且

eitx=cos(tx)+isin(tx)

根据上述定义, φX(t) FX(x) 的傅里叶变换。因此 φX(t) FX(x) 包含相同的信息,且是一一对应的。特别的,若X的PDF fX(x) 存在,则可通过傅立叶逆变换得到:

fX(x)=12π+eitxφX(t)dt

特征函数具有连续可微等良好的分析性质,因此对于那些矩母函数(Moment Generating Function,MGF)不存在的分布(如柯西分布和对数正态分布)很有用处。

特征函数本质上不是概率论的内容,而属于函数论的内容。不用傅立叶变换,用拉普拉斯变换、希尔伯特变换等等,也可能产生类似效果,当然具体结论会颇有不同。

双曲函数和悬链线

悬链线 (Catenary) 是一种曲线,因其与两端固定的绳子在均匀引力作用下下垂相似而得名。适当选择坐标系后,悬链线的方程是一个双曲余弦函数。

悬链线背后的故事和推导,百度百科已经比较详细了,不再赘述。参见:

http://baike.baidu.com/view/45656.htm

然而对于实际工程中的悬索结构,由于悬索自身的重量较其所提拉的跨度结构要轻得多,在力学简单计算中可以忽略,结构受力模式成为在水平长度范围内的均布荷载。这种荷载模式与拱结构相同,因此可以推导出在该荷载模式下的悬垂线为一抛物线,线型与拱结构相同,但内力为拉力。

在工程中完全按照悬链线进行设计的结构,恐怕只有高压输电线了。由于不承担任何自重以外的附加荷载,输电线的数学曲线会与悬链线完全一致。

双曲函数的性质,参见:

https://zhuanlan.zhihu.com/p/20042215

这里写图片描述

这里写图片描述

概率分布

进入正题之前,先介绍两个函数:贝塔函数和伽马函数。

贝塔函数

B(α,β)=10xα1(1x)β1dx

伽马函数

Γ(θ)=0xθ1exdx

http://cos.name/2013/01/lda-math-gamma-function/

这篇文章对伽马函数的历史由来,讲的比较透彻。

简单来说,伽马函数就是阶乘算子在复数域的扩展。

伽马函数有以下一些性质:

Γ(x+1)=xΓ(x)

Γ(n)=(n1)!,n

Γ(1x)Γ(x)=πsin(πx),x(0,1)

Γ(12)=π

B(m,n)=Γ(m)Γ(n)Γ(m+n)

参考:

http://blog.csdn.net/u010945683/article/details/48950063

排列组合

排列组合是高中数学的内容,这里仅列出公式,以备参考。

Pmn=n!(nm)!

Cmn=Pmnm!=n!m!(nm)!

Cmn 有时也被记作 (nm) ,注意这两种表示法的上下标的顺序。

伯努利试验

伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验。其特点是该随机试验只有两种可能结果:发生或者不发生。然后我们假设该项试验独立重复地进行了n次,那么我们就称这一系列重复独立的随机试验为n重伯努利试验,或称为伯努利概型。

n重伯努利试验导出了两个重要的分布。

二项分布

n重伯努利试验中,事件A发生K次的概率是:

Pr(X=k)=(nk)pk(1p)nk

其中,p为单次试验中,事件A发生的概率。

这种分布,被称为二项分布(Binomial Distribution)。特别的,当n=1时,被称为伯努利分布。

几何分布

几何分布(Geometric distribution)有两个定义:

1.在n重伯努利试验中,试验k次才得到第一次成功的概率:

Pr(X=k)=(1p)k1p

1.在n重伯努利试验中,第一次成功之前,失败k次的概率:

Pr(Y=k)=(1p)kp

显然 Y=X1

二项分布的极限

二项分布实际上有两个极限分布。

如上所述,二项分布有两个参数n和p。

如果p为定值, n ,则极限分布为正态分布。正态分布的性质参见《图像处理理论(一)》。

如果 p0,n ,则极限分布为泊松分布(Poisson distribution)。

泊松分布

泊松分布有两个定义:

定义一:一个随机变量X, 只能取值非负整数(x=0,1,2,…),且相应的概率为 eλλxx! ,则称该变量服从poisson分布。

定义二:假定一个事件在一段时间内随机发生,且符合以下条件:

(1)将该时间段无限分隔成若干个小的时间段,在这个接近于零的小时间段里,该事件发生一次的概率与这个极小时间段的长度成正比。

(2)在每一个极小时间段内,该事件发生两次及以上的概率恒等于零。

(3)该事件在不同的小时间段里,发生与否相互独立。

则该事件称为poisson process。

比如,一段时间t内,电话交换站收到的呼叫次数k,就是泊松分布的。很显然,呼叫次数和时间是有关系的,时间越长,呼叫次数越多。反之, t0 ,则 k0 。这正好符合二项分布的泊松极限的定义。

泊松分布的独特之处,还在于它的两个要素t和k,一个是连续型随机变量,另一个是离散型随机变量。无形之中,它成为了这两类变量之间的桥梁。与此相关的数学分支,一般被称为泊松分析。

仍以上面的例子为例,如果反过来,求两次来电的时间间隔t,则t符合指数分布

参考:

https://www.zhihu.com/question/26441147

http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

贝塔分布和共轭先验分布

f(x;α,β)=xα1(1x)β1B(α,β)

贝塔分布的PDF和CDF如下图所示:

这里写图片描述

这里写图片描述

从上图可以看出它是个百变星君,它可以是凹的、凸的、单调上升的、单调下降的;可以是曲线也可以是直线。由于Beta分布能够拟合如此之多的形状,因此它在统计数据拟合中,被广泛使用。

下面来讲一下Beta分布的推导,并引出共轭先验分布的概念。

设一事件A的概率 p(A)=θ ,为了估计 θ 的值,作了n次独立观察,其中事件A出现的次数为X。显然X服从二项分布 XB(n,θ)

因此:

p(X=x|θ)=(nx)θx(1θ)nx

利用贝叶斯公式,我们首先需要确定先验概率 p(θ) 。在未得到其余信息前,我们只能认为 θ 在(0,1)上均匀分布(即 θUniform(0,1) ),这是一种不失偏颇的先验估计。

则联合概率分布为:

p(x,θ)=p(x|θ)p(θ)

边缘概率分布:

p(x)=10p(x,θ)dθ=10(nx)θx(1θ)nxdθ=(nx)B(x+1,nx+1)=(nx)Γ(x+1)Γ(nx+1)Γ(n+2)

综合以上,可得 θ 的后验分布:

p(θ|x)=p(x,θ)p(x)=θ(x+1)1(1θ)(nx+1)1B(x+1,nx+1)

因此: θ|xBeta(x+1,nx+1)

考虑到

Uniform(0,1)=Beta(1,1)
,因此在这个例子中,先验分布和后验分布,实际上是同一类型的分布。这种情况被称为共轭先验分布。

上述过程的形式化描述为:

Uniform(θ)+B(n,θ)Beta(x+1,nx+1)

+

定义:设 θ 是某分布中的一个参数, π(θ) 是其先验分布。假如由抽样信息算得的后验分布 π(θ|x) π(θ) 同属于一个分布族,则称 π(θ) θ 共轭先验分布

从这个定义可以看出,共轭先验分布是对某一分布中的参数而言的,离开指定参数及其所在的分布,谈论共轭先验分布是没有意义的。

常见的共轭先验分布:

总体分布参数共轭先验分布
二项分布成功概率贝塔分布
泊松分布均值伽马分布
指数分布均值倒数伽马分布
正态分布(方差已知)均值正态分布
正态分布(方差未知)方差倒伽马分布

共轭先验分布中,由于先验分布和后验分布都是同一个分布族,因此有利于简化计算。同时,先验参数往往会传递到后验分布,这样就能够比较方便的确定参数的实际意义。

多项分布和狄利克雷分布

伯努利试验只有两个可能的实验结果,如果实验结果的个数超过2个,那么二项分布就变成了多项分布(multinomial distribution):

f(x1,,xk;n,p1,,pk)=n!x1!xk!px11pxkk

多项分布对应的共轭先验分布是狄利克雷分布(Dirichlet distribution):

f(x1,,xK;α1,,αK)=1B(α)i=1Kxαi1i(1)

这里引入向量表示的贝塔函数:

B(α)=Ki=1Γ(αi)Γ(Ki=1αi),α=(α1,,αK)

狄利克雷分布的密度函数如下所示(3维):

这里写图片描述

上面的图,实际上是个4维图,只不过用一个平面上的三角形代表实验结果的3维而已。这也是一种高维数据可视化的方法。

参考:

http://cos.name/2013/01/lda-math-beta-dirichlet/

http://www.cs.cmu.edu/~epxing/Class/10701-08s/recitation/dirichlet.pdf

各种概率分布的关系

这里写图片描述

参考:

http://www.math.wm.edu/~leemis/2008amstat.pdf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值