数学期望和方差
假如现在你面前有一个按钮,按下按钮后你有20%的几率获得500元,80%的几率获得1500元。那么当你多次按下按钮时,你平均获得的钱数是多少呢?
根据概率的计算方法,你有20%的几率获得500元,80%的几率获得1500元。所以你平均下来获得的钱就是 20 % × 500 + 80 % × 1500 20\%\times500+80\%\times1500 20%×500+80%×1500,就是1300元。
这个数值1300就是期望。
数学期望 mean就是试验中每次可能结果的概率乘以其结果的总和,它表示了随机变量的平均取值。它的计算方法就是将所有可能的变量取值乘上概率在相加,也就是:
E ( x ) = ∑ k = 1 ∞ x k p k E(x)=\sum\limits_{k=1}^{\infty} x_kp_k E(x)=k=1∑∞xkpk
是不是有点像加权平均值?
总体样本的方差也可以用 μ \mu μ表示。
连续变量也有期望。比如你随机选出一个数,它的期望也是你选出这个数所有的可能乘上概率,只不过这次要用定积分计算,而且概率函数变为概率密度函数:
E ( x ) = ∫ − ∞ + ∞ x f ( x ) d x E(x)=\int_{-\infty}^{+\infty}xf(x)\mathrm dx E(x)=∫−∞+∞xf(x)dx
期望可以是正的或者负的。比如赌博的时候赢钱的期望就是负数(否则赌场就倒闭了)。
例子:随机在下面的集合中选出一个数 x x x:
{ 1 , 2 , 3 , 4 , 2 , 1 , 4 , 5 , 6 , 3 , 2 , 3 , 4 , 3 , 4 } \{1,2,3,4,2,1,4,5,6,3,2,3,4,3,4\} {1,2,3,4,2,1,4,5,6,3,2,3,4,3,4}
x x x的期望是多少?
要计算期望,我们首先要求每个取值的概率:
| 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|
| 2/15 | 3/15 | 4/15 | 4/15 | 1/15 | 1/15 |
再讲每个取值和概率相乘求和
E ( x ) = 1 ⋅ 2 15 + 2 ⋅ 3 15 + 3 ⋅ 4 15 + 4 ⋅ 4 15 + 5 ⋅ 1 15 + 6 ⋅ 1 15 E(x)=1\cdot\dfrac2{15}+2\cdot\dfrac3{15}+3\cdot\dfrac4{15}+4\cdot\dfrac4{15}+5\cdot\dfrac1{15}+6\cdot\dfrac1{15} E(x)=1⋅152+2⋅153+3⋅154+4⋅154+5⋅151+6⋅151
= 47 15 ≈ 3.133 =\dfrac{47}{15}\approx3.133 =1547≈3.133
咦?等一等,这不就是这些数的平均数吗?
是的,有时候期望和平均数是分不开的。所以数学期望又称为"均值"。两者在计算方法上也很相似,期望就是加权的平均值。
期望的运算律:
E ( C ) = C E(C)=C E(C)=C
E ( a x ) = a E ( x ) E(ax)=aE(x) E(ax)=aE(x)
E ( x + y ) = E ( x ) + E ( y ) E(x+y)=E(x)+E(y) E(x+y)=E(x)+E(y)
第一个公式的意思就是任何一个常数的期望是他本身。
第二个公式的意思就是假如随机变量 x x x的取值翻了 a a a倍,那么期望也会翻 a a a倍。
第三个公式的意思是如果你同时取两个随机变量 x , y x,y x,y,那么你获得的期望就是两个变量的期望相加。
也就是,期望也可以做线性运算。
期望说完后,我们再来说说一说方差。实际上,一共有三种方差。
统计学中的方差用 σ 2 \sigma^2 σ2表示,计算方法如下:
σ 2 ( x ) = ∑ k = 1 N ( x k − μ ) 2 N \sigma^2(x)=\dfrac{\sum\limits_{k=1}^N(x_k-\mu)^2}N σ2(x)=Nk=1∑N(xk−μ)2
其中 N N N为总体个数, x k x_k xk为第 k k k个数, μ \mu μ为样本的期望,或者说是平均值。
实际情况中没办法穷举所有例子,计算方差要用样本方差。样本方差用 S 2 ( x ) S^2(x) S2(x)表示。样本方差计算方法如下:
S 2 ( x ) = ∑ k = 1 n ( x k − μ ) 2 n − 1 S^2(x)=\dfrac{\sum\limits_{k=1}^n(x_k-\mu)^2}{n-1} S2(x)=n−1k=1∑n(xk−μ)2
可是,样本方差的分母为什么是 n − 1 n-1 n−1而不是 n n n呢?可以参考这篇博客。
在概率论中的方差又是另一个概念。概率论中的方差用 D ( x ) D(x) D(x)或者 V a r ( x ) Var(x) Var(x)表示。
D ( x ) = E [ ( x − E ( x ) ) 2 ] D(x)=E[(x-E(x))^2] D(x)=E[(x−E(x))2]
也就是 ( x − E ( x ) ) 2 (x-E(x))^2 (x−E(x))2这个表达式的期望。其实计算方法和 σ 2 ( x ) \sigma^2(x) σ2(x)差不多。
D ( x ) D(x) D(x)还有更简便的算法:
D ( x ) = E [ ( x − E ( x ) ) 2 ] D(x)=E[(x-E(x))^2] D(x)=E[(x−E(x))2]
= E ( x 2 − 2 x E ( x ) + E ( x ) 2 ) =E(x^2-2xE(x)+E(x)^2) =E(x2−2xE(x)+E(x)2)
= E ( x 2 ) − E [ 2 x E ( x ) ] + E ( E ( x ) 2 ) =E(x^2)-E[2xE(x)]+E(E(x)^2) =E(x2)−E[2xE(x)]+E(E(x)2)
因为 E ( x ) E(x) E(x)是一个常数,所以 E [ 2 x E ( x ) ] = 2 E ( x ) E ( x ) = 2 E ( x ) 2 E[2xE(x)]=2E(x)E(x)=2E(x)^2 E[2xE(x)]=2E(x)E(x)=2E(x)2。又因为 E ( C ) = C E(C)=C E(C)=C
所以 D ( x ) = E ( x 2 ) − 2 E ( x ) 2 + E ( x ) 2 D(x)=E(x^2)-2E(x)^2+E(x)^2 D(x)=E(x2)−2E(x)2+E(x)2
= E ( x 2 ) − E ( x ) 2 =E(x^2)-E(x)^2 =E(x2)−E(x)2
这是方差的简便算法。
标准差就是方差的平方根,在概率论中也是如此。
方差的性质(只有孤零零的一条):
D ( c x ) = c 2 D ( x ) D(cx)=c^2D(x) D(cx)=c2D(x)
证明: D ( c x ) = c 2 E ( x 2 ) − ( c E ( x ) ) 2 = c 2 ( E ( x 2 ) − E ( x ) 2 ) = c 2 D ( x ) D(cx)=c^2E(x^2)-(cE(x))^2=c^2(E(x^2)-E(x)^2)=c^2D(x) D(cx)=c2E(x2)−(cE(x))2=c2(E(x2)−E(x)2)=c2D(x)
当然,方差只能代表绝对的离散程度,并不能代表相对的离散程度。比如我将随机变量 x x x的取值翻倍,方差就会翻 4 4 4倍,但是这个变量的概率密度曲线并没有发生太大的变化。所以,我们用变异系数来表示变量取值的相对离散程度。变异系数 c v = σ μ c_v=\dfrac\sigma\mu cv=μσ,其中 c v c_v cv是变异系数, σ \sigma σ是标准差,即方差开方, μ \mu μ是数学期望。
数学期望表示随机变量的平均取值,可以用概率乘以对应的变量值求和来计算。对于离散随机变量,它类似于加权平均值。而方差则衡量随机变量的离散程度,统计学中的方差是各数值与均值差的平方和的平均,概率论中的方差是(X-期望)²的期望。方差的平方根是标准差,变异系数用来表示相对离散程度。

9033

被折叠的 条评论
为什么被折叠?



