数学期望和方差

数学期望表示随机变量的平均取值,可以用概率乘以对应的变量值求和来计算。对于离散随机变量,它类似于加权平均值。而方差则衡量随机变量的离散程度,统计学中的方差是各数值与均值差的平方和的平均,概率论中的方差是(X-期望)²的期望。方差的平方根是标准差,变异系数用来表示相对离散程度。

数学期望和方差

假如现在你面前有一个按钮,按下按钮后你有20%的几率获得500元,80%的几率获得1500元。那么当你多次按下按钮时,你平均获得的钱数是多少呢?

根据概率的计算方法,你有20%的几率获得500元,80%的几率获得1500元。所以你平均下来获得的钱就是 20 % × 500 + 80 % × 1500 20\%\times500+80\%\times1500 20%×500+80%×1500,就是1300元。

这个数值1300就是期望

数学期望 mean就是试验中每次可能结果的概率乘以其结果的总和,它表示了随机变量的平均取值。它的计算方法就是将所有可能的变量取值乘上概率在相加,也就是:

E ( x ) = ∑ k = 1 ∞ x k p k E(x)=\sum\limits_{k=1}^{\infty} x_kp_k E(x)=k=1xkpk

是不是有点像加权平均值?

总体样本的方差也可以用 μ \mu μ表示。

连续变量也有期望。比如你随机选出一个数,它的期望也是你选出这个数所有的可能乘上概率,只不过这次要用定积分计算,而且概率函数变为概率密度函数:

E ( x ) = ∫ − ∞ + ∞ x f ( x ) d x E(x)=\int_{-\infty}^{+\infty}xf(x)\mathrm dx E(x)=+xf(x)dx

期望可以是正的或者负的。比如赌博的时候赢钱的期望就是负数(否则赌场就倒闭了)。

例子:随机在下面的集合中选出一个数 x x x

{ 1 , 2 , 3 , 4 , 2 , 1 , 4 , 5 , 6 , 3 , 2 , 3 , 4 , 3 , 4 } \{1,2,3,4,2,1,4,5,6,3,2,3,4,3,4\} {1,2,3,4,2,1,4,5,6,3,2,3,4,3,4}

x x x的期望是多少?

要计算期望,我们首先要求每个取值的概率:

123456
2/153/154/154/151/151/15

再讲每个取值和概率相乘求和

E ( x ) = 1 ⋅ 2 15 + 2 ⋅ 3 15 + 3 ⋅ 4 15 + 4 ⋅ 4 15 + 5 ⋅ 1 15 + 6 ⋅ 1 15 E(x)=1\cdot\dfrac2{15}+2\cdot\dfrac3{15}+3\cdot\dfrac4{15}+4\cdot\dfrac4{15}+5\cdot\dfrac1{15}+6\cdot\dfrac1{15} E(x)=1152+2153+3154+4154+5151+6151

= 47 15 ≈ 3.133 =\dfrac{47}{15}\approx3.133 =15473.133

咦?等一等,这不就是这些数的平均数吗?

是的,有时候期望和平均数是分不开的。所以数学期望又称为"均值"。两者在计算方法上也很相似,期望就是加权的平均值。

期望的运算律:

E ( C ) = C E(C)=C E(C)=C

E ( a x ) = a E ( x ) E(ax)=aE(x) E(ax)=aE(x)

E ( x + y ) = E ( x ) + E ( y ) E(x+y)=E(x)+E(y) E(x+y)=E(x)+E(y)

第一个公式的意思就是任何一个常数的期望是他本身。

第二个公式的意思就是假如随机变量 x x x的取值翻了 a a a倍,那么期望也会翻 a a a倍。

第三个公式的意思是如果你同时取两个随机变量 x , y x,y x,y,那么你获得的期望就是两个变量的期望相加。

也就是,期望也可以做线性运算。

期望说完后,我们再来说说一说方差。实际上,一共有三种方差。

统计学中的方差用 σ 2 \sigma^2 σ2表示,计算方法如下:

σ 2 ( x ) = ∑ k = 1 N ( x k − μ ) 2 N \sigma^2(x)=\dfrac{\sum\limits_{k=1}^N(x_k-\mu)^2}N σ2(x)=Nk=1N(xkμ)2

其中 N N N为总体个数, x k x_k xk为第 k k k个数, μ \mu μ为样本的期望,或者说是平均值。

实际情况中没办法穷举所有例子,计算方差要用样本方差。样本方差用 S 2 ( x ) S^2(x) S2(x)表示。样本方差计算方法如下:

S 2 ( x ) = ∑ k = 1 n ( x k − μ ) 2 n − 1 S^2(x)=\dfrac{\sum\limits_{k=1}^n(x_k-\mu)^2}{n-1} S2(x)=n1k=1n(xkμ)2

可是,样本方差的分母为什么是 n − 1 n-1 n1而不是 n n n呢?可以参考这篇博客

在概率论中的方差又是另一个概念。概率论中的方差用 D ( x ) D(x) D(x)或者 V a r ( x ) Var(x) Var(x)表示。

D ( x ) = E [ ( x − E ( x ) ) 2 ] D(x)=E[(x-E(x))^2] D(x)=E[(xE(x))2]

也就是 ( x − E ( x ) ) 2 (x-E(x))^2 (xE(x))2这个表达式的期望。其实计算方法和 σ 2 ( x ) \sigma^2(x) σ2(x)差不多。

D ( x ) D(x) D(x)还有更简便的算法:

D ( x ) = E [ ( x − E ( x ) ) 2 ] D(x)=E[(x-E(x))^2] D(x)=E[(xE(x))2]

= E ( x 2 − 2 x E ( x ) + E ( x ) 2 ) =E(x^2-2xE(x)+E(x)^2) =E(x22xE(x)+E(x)2)

= E ( x 2 ) − E [ 2 x E ( x ) ] + E ( E ( x ) 2 ) =E(x^2)-E[2xE(x)]+E(E(x)^2) =E(x2)E[2xE(x)]+E(E(x)2)

因为 E ( x ) E(x) E(x)是一个常数,所以 E [ 2 x E ( x ) ] = 2 E ( x ) E ( x ) = 2 E ( x ) 2 E[2xE(x)]=2E(x)E(x)=2E(x)^2 E[2xE(x)]=2E(x)E(x)=2E(x)2。又因为 E ( C ) = C E(C)=C E(C)=C

所以 D ( x ) = E ( x 2 ) − 2 E ( x ) 2 + E ( x ) 2 D(x)=E(x^2)-2E(x)^2+E(x)^2 D(x)=E(x2)2E(x)2+E(x)2

= E ( x 2 ) − E ( x ) 2 =E(x^2)-E(x)^2 =E(x2)E(x)2

这是方差的简便算法。

标准差就是方差的平方根,在概率论中也是如此。

方差的性质(只有孤零零的一条):

D ( c x ) = c 2 D ( x ) D(cx)=c^2D(x) D(cx)=c2D(x)

证明: D ( c x ) = c 2 E ( x 2 ) − ( c E ( x ) ) 2 = c 2 ( E ( x 2 ) − E ( x ) 2 ) = c 2 D ( x ) D(cx)=c^2E(x^2)-(cE(x))^2=c^2(E(x^2)-E(x)^2)=c^2D(x) D(cx)=c2E(x2)(cE(x))2=c2(E(x2)E(x)2)=c2D(x)

当然,方差只能代表绝对的离散程度,并不能代表相对的离散程度。比如我将随机变量 x x x的取值翻倍,方差就会翻 4 4 4倍,但是这个变量的概率密度曲线并没有发生太大的变化。所以,我们用变异系数来表示变量取值的相对离散程度。变异系数 c v = σ μ c_v=\dfrac\sigma\mu cv=μσ,其中 c v c_v cv是变异系数, σ \sigma σ是标准差,即方差开方, μ \mu μ是数学期望。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值