数学狂想曲（二）——拉普拉斯变换, 随机变量的特征函数, 双曲函数和悬链线, 概率分布

最新推荐文章于 2026-03-31 09:36:14 发布

原创最新推荐文章于 2026-03-31 09:36:14 发布 · 1.4w 阅读

24 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#数学

数学狂想曲专栏收录该内容

15 篇文章

订阅专栏

本文介绍了拉普拉斯变换、傅里叶变换等数学变换的基本概念，以及这些变换与信号处理的关系。此外，还深入探讨了概率论中的核心概念，包括特征函数、贝塔分布、伽玛分布等，并讨论了这些分布之间的联系。

拉普拉斯变换

F (s) = \int \infty 0 e - s t f (t) d t, s = σ + i ω

$F(s) =\int_0^\infty e^{-st} f(t)\mathrm{d}t,s = \sigma + i \omega$

傅里叶变换的收敛有一个狄利克雷条件，要求信号绝对可积/绝对可和。

为了使不满足这一条件的信号，也能读出它的“频率”，可以采用拉普拉斯变换和Z变换。它们对“频率”的含义做出了扩充，使得大多数有用信号都具有了对应的“频率”域表达式。

拉普拉斯变换将频率从实数推广为复数，因而傅里叶变换变成了拉普拉斯变换的一个特例。当s为纯虚数时， $x(t)$ 的拉普拉斯变换，即为 $x(t)$ 的傅里叶变换。

从图像的角度来说，拉普拉斯变换得到的频谱是一个复平面上的函数。

这里写图片描述

而傅里叶变换得到的频谱，则是从虚轴上切一刀，得到的函数的剖面。

这里写图片描述

参考：

https://www.zhihu.com/question/22085329

随机变量的特征函数

特征函数是描述随机变量概率分布的重要工具，其定义如下。

设随机变量X的CDF为 $F_X(x)$ ，则其特征函数定义为：

φ X (t) = E (e i t X) = \int + \infty - \infty e i t x d F X (x)

$\varphi_X(t)=E(e^{itX})=\int_{-\infty}^{+\infty}e^{itx}\mathrm{d}F_X(x)$

其中， $i=\sqrt{-1}$ ，并且

e i t x = cos (t x) + i sin (t x)

$e^{itx}=\cos(tx)+i\sin(tx)$

根据上述定义， $\varphi_X(t)$ 是 $F_X(x)$ 的傅里叶变换。因此 $\varphi_X(t)$ 和 $F_X(x)$ 包含相同的信息，且是一一对应的。特别的，若X的PDF $f_X(x)$ 存在，则可通过傅立叶逆变换得到：

f X (x) = 1 2 π \int + \infty - \infty e - i t x φ X (t) d t

$f_X(x)=\frac{1}{2\pi}\int_{-\infty}^{+\infty}e^{-itx}\varphi_X(t)\mathrm{d}t$

特征函数具有连续可微等良好的分析性质，因此对于那些矩母函数（Moment Generating Function，MGF）不存在的分布（如柯西分布和对数正态分布）很有用处。

特征函数本质上不是概率论的内容，而属于函数论的内容。不用傅立叶变换，用拉普拉斯变换、希尔伯特变换等等，也可能产生类似效果，当然具体结论会颇有不同。

双曲函数和悬链线

悬链线 (Catenary) 是一种曲线，因其与两端固定的绳子在均匀引力作用下下垂相似而得名。适当选择坐标系后，悬链线的方程是一个双曲余弦函数。

悬链线背后的故事和推导，百度百科已经比较详细了，不再赘述。参见：

http://baike.baidu.com/view/45656.htm

然而对于实际工程中的悬索结构，由于悬索自身的重量较其所提拉的跨度结构要轻得多，在力学简单计算中可以忽略，结构受力模式成为在水平长度范围内的均布荷载。这种荷载模式与拱结构相同，因此可以推导出在该荷载模式下的悬垂线为一抛物线，线型与拱结构相同，但内力为拉力。

在工程中完全按照悬链线进行设计的结构，恐怕只有高压输电线了。由于不承担任何自重以外的附加荷载，输电线的数学曲线会与悬链线完全一致。

双曲函数的性质，参见：

https://zhuanlan.zhihu.com/p/20042215

这里写图片描述

概率分布

进入正题之前，先介绍两个函数：贝塔函数和伽马函数。

贝塔函数

B (α, β) = \int 10 x α - 1 (1 - x) β - 1 d x

$B(\alpha,\beta)=\int_{0}^{1}x^{\alpha-1}(1-x)^{\beta-1}dx$

伽马函数

Γ (θ) = \int \infty 0 x θ - 1 e - x d x

$\Gamma(\theta)=\int_{0}^{\infty}x^{\theta-1}e^{-x}dx$

http://cos.name/2013/01/lda-math-gamma-function/

这篇文章对伽马函数的历史由来，讲的比较透彻。

简单来说，伽马函数就是阶乘算子在复数域的扩展。

伽马函数有以下一些性质：

Γ (x + 1) = x Γ (x)

$\Gamma(x+1)=x\Gamma(x)$

Γ (n) = (n - 1)!, n 为 整 数

$\Gamma(n)=(n-1)!,n为整数$

Γ (1 - x) Γ (x) = π sin ( π x ), x \in (0, 1)

${\Gamma(1-x)\Gamma(x)}=\frac{\pi}{\sin(\pi x)},x\in{(0,1)}$

Γ (1 2) = π ‾ ‾ \sqrt

$\Gamma({1 \over 2})=\sqrt{\pi}$

B (m, n) = Γ ( m ) Γ ( n ) Γ ( m + n )

$B(m,n) = \frac{\Gamma(m)\Gamma(n)}{\Gamma(m+n)}$

参考：

http://blog.csdn.net/u010945683/article/details/48950063

排列组合

排列组合是高中数学的内容，这里仅列出公式，以备参考。

P m n = n ! ( n - m ) !

$P^m_n=\frac{n!}{(n-m)!}$

C m n = P m n m ! = n ! m ! ( n - m ) !

$C^m_n=\frac{P^m_n}{m!}=\frac{n!}{m!(n-m)!}$

$C^m_n$ 有时也被记作 $\binom{n}{m}$ ，注意这两种表示法的上下标的顺序。

伯努利试验

伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验。其特点是该随机试验只有两种可能结果：发生或者不发生。然后我们假设该项试验独立重复地进行了n次，那么我们就称这一系列重复独立的随机试验为n重伯努利试验，或称为伯努利概型。

n重伯努利试验导出了两个重要的分布。

二项分布

n重伯努利试验中，事件A发生K次的概率是：

Pr (X = k) = (n k) p k (1 - p) n - k

$\Pr(X = k) = \binom n k p^k(1-p)^{n-k}$

其中，p为单次试验中，事件A发生的概率。

这种分布，被称为二项分布（Binomial Distribution）。特别的，当n=1时，被称为伯努利分布。

几何分布

几何分布（Geometric distribution）有两个定义：

1.在n重伯努利试验中，试验k次才得到第一次成功的概率：

Pr (X = k) = (1 - p) k - 1 p

$\Pr(X = k) = (1-p)^{k-1}\,p\,$

1.在n重伯努利试验中，第一次成功之前，失败k次的概率：

Pr (Y = k) = (1 - p) k p

$\Pr(Y=k) = (1 - p)^k\,p\,$

显然 $Y=X-1$ 。

二项分布的极限

二项分布实际上有两个极限分布。

如上所述，二项分布有两个参数n和p。

如果p为定值， $n\to\infty$ ，则极限分布为正态分布。正态分布的性质参见《图像处理理论（一）》。

如果 $p\to 0,n\to\infty$ ，则极限分布为泊松分布（Poisson distribution）。

泊松分布

泊松分布有两个定义：

定义一：一个随机变量X, 只能取值非负整数（x=0,1,2,…），且相应的概率为 $e^{-\lambda }\frac{\lambda ^x}{x!}$ ，则称该变量服从poisson分布。

定义二：假定一个事件在一段时间内随机发生，且符合以下条件：

（1）将该时间段无限分隔成若干个小的时间段，在这个接近于零的小时间段里，该事件发生一次的概率与这个极小时间段的长度成正比。

（2）在每一个极小时间段内，该事件发生两次及以上的概率恒等于零。

（3）该事件在不同的小时间段里，发生与否相互独立。

则该事件称为poisson process。

比如，一段时间t内，电话交换站收到的呼叫次数k，就是泊松分布的。很显然，呼叫次数和时间是有关系的，时间越长，呼叫次数越多。反之， $t\to 0$ ，则 $k\to 0$ 。这正好符合二项分布的泊松极限的定义。

泊松分布的独特之处，还在于它的两个要素t和k，一个是连续型随机变量，另一个是离散型随机变量。无形之中，它成为了这两类变量之间的桥梁。与此相关的数学分支，一般被称为泊松分析。

仍以上面的例子为例，如果反过来，求两次来电的时间间隔t，则t符合指数分布。

参考：

https://www.zhihu.com/question/26441147

http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

贝塔分布和共轭先验分布

f (x; α, β) = x α - 1 ( 1 - x ) β - 1 B ( α , β )

$f(x;\alpha,\beta)=\frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)}$

贝塔分布的PDF和CDF如下图所示：

这里写图片描述

从上图可以看出它是个百变星君，它可以是凹的、凸的、单调上升的、单调下降的；可以是曲线也可以是直线。由于Beta分布能够拟合如此之多的形状，因此它在统计数据拟合中，被广泛使用。

下面来讲一下Beta分布的推导，并引出共轭先验分布的概念。

设一事件A的概率 $p(A)=\theta$ ，为了估计 $\theta$ 的值，作了n次独立观察，其中事件A出现的次数为X。显然X服从二项分布 $X\sim B(n,\theta)$ 。

因此：

p (X = x | θ) = (n x) θ x (1 - θ) n - x

$p(X=x|\theta)= \binom{n}{x}\theta^{x}(1-\theta)^{n-x}$

利用贝叶斯公式，我们首先需要确定先验概率 $p(\theta)$ 。在未得到其余信息前，我们只能认为 $\theta$ 在(0,1)上均匀分布（即 $\theta\sim Uniform(0,1)$ ），这是一种不失偏颇的先验估计。

则联合概率分布为：

p (x, θ) = p (x | θ) p (θ)

$p(x,\theta)=p(x|\theta)p(\theta)$

边缘概率分布：

p (x) = \int 10 p (x, θ) d θ = \int 10 (n x) θ x (1 - θ) n - x d θ = (n x) B (x + 1, n - x + 1) = (n x) Γ ( x + 1 ) Γ ( n - x + 1 ) Γ ( n + 2 )

$\begin{align}p(x)&=\int_{0}^{1}p(x,\theta)d\theta=\int_{0}^{1}\binom{n}{x}\theta^{x}(1-\theta)^{n-x}d\theta\\ &=\binom{n}{x}B(x+1,n-x+1)=\binom{n}{x}\frac{\Gamma(x+1)\Gamma(n-x+1)}{\Gamma(n+2)}\end{align}$

综合以上，可得 $\theta$ 的后验分布:

p (θ | x) = p ( x , θ ) p ( x ) = θ ( x + 1 ) - 1 ( 1 - θ ) ( n - x + 1 ) - 1 B ( x + 1 , n - x + 1 )

$p(\theta|x)=\frac{p(x,\theta)}{p(x)}=\frac{\theta^{(x+1)-1}(1-\theta)^{(n-x+1)-1}}{B(x+1,n-x+1)}$

因此： $\theta \vert x\sim Beta(x+1,n-x+1)$

考虑到

U n i f o r m (0, 1) = B e t a (1, 1)

$Uniform(0,1)=Beta(1,1)$ ，因此在这个例子中，先验分布和后验分布，实际上是同一类型的分布。这种情况被称为共轭先验分布。

上述过程的形式化描述为：

U n i f o r m (θ) + B (n, θ) \to B e t a (x + 1, n - x + 1)

$Uniform(\theta)+B(n,\theta)\to Beta(x+1,n-x+1)$

即

先 验 参 数 分 布 + 数 据 分 布 \to 后 验 分 布

$先验参数分布+数据分布\to 后验分布$

定义：设 $\theta$ 是某分布中的一个参数， $\pi(\theta)$ 是其先验分布。假如由抽样信息算得的后验分布 $\pi(\theta \vert x)$ 与 $\pi(\theta)$ 同属于一个分布族，则称 $\pi(\theta)$ 是 $\theta$ 的共轭先验分布。

从这个定义可以看出，共轭先验分布是对某一分布中的参数而言的，离开指定参数及其所在的分布，谈论共轭先验分布是没有意义的。

常见的共轭先验分布：

总体分布	参数	共轭先验分布
二项分布	成功概率	贝塔分布
泊松分布	均值	伽马分布
指数分布	均值倒数	伽马分布
正态分布（方差已知）	均值	正态分布
正态分布（方差未知）	方差	倒伽马分布

共轭先验分布中，由于先验分布和后验分布都是同一个分布族，因此有利于简化计算。同时，先验参数往往会传递到后验分布，这样就能够比较方便的确定参数的实际意义。

多项分布和狄利克雷分布

伯努利试验只有两个可能的实验结果，如果实验结果的个数超过2个，那么二项分布就变成了多项分布（multinomial distribution）：

f (x 1, \dots, x k; n, p 1, \dots, p k) = n ! x 1 ! \dots x k ! p x 1 1 \dots p x k k

$f(x_1,\ldots,x_k;n,p_1,\ldots,p_k)=\frac{n!}{x_1!\cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}$

多项分布对应的共轭先验分布是狄利克雷分布（Dirichlet distribution）：

f (x 1, \dots, x K; α 1, \dots, α K) = 1 B ( α ) \prod i = 1 K x α i - 1 i (1)

$f \left(x_1,\cdots, x_{K}; \alpha_1,\cdots, \alpha_K \right) = \frac{1}{\mathrm{B}(\boldsymbol\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1}\tag{1}$

这里引入向量表示的贝塔函数：

B (α) = \prod K i = 1 Γ ( α i ) Γ ( \sum K i = 1 α i ), α = (α 1, \dots, α K)

$\mathrm{B}(\boldsymbol\alpha) = \frac{\prod_{i=1}^K \Gamma(\alpha_i)}{\Gamma\left(\sum_{i=1}^K \alpha_i\right)},\qquad\boldsymbol{\alpha}=(\alpha_1,\cdots,\alpha_K)$

狄利克雷分布的密度函数如下所示(3维)：

这里写图片描述