19.数理统计备考(1)

本文深入探讨了数理统计的基本概念与高级主题,包括样本、统计量、分布族、经验分布函数等内容,详细讲解了正态分布、Γ分布、B分布、三大分布等常用分布及其性质,同时介绍了次序统计量、指数族、充分完全统计量等关键知识点。

备考篇(1)

第一章

本章是数理统计中的基本知识和基础概念,包含样本、统计量、样本分布、经验分布函数等基本内容。

样本是从总体中抽取的一部分个体,具有两重性。当样本作为随机变量看待时,拥有和总体一样的分布函数,同时样本也有联合分布函数,其联合密度函数或联合密度函数为
f(x1,⋯ ,xn)=f(x1)f(x2)⋯f(xn) f(x_1,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n) f(x1,,xn)=f(x1)f(x2)f(xn)
统计量是样本的函数,是根据样本可以直接算出的值。常用的统计量有样本均值、样本方差、经验分布函数、样本偏度与样本峰度、样本矩等。其中样本均值和样本方差最为常用,为
Xˉ=1n∑i=1nXi,S2=1n−1∑i=1n(Xi−Xˉ)2 \bar X=\frac1n\sum_{i=1}^nX_i, S^2=\frac1{n-1}\sum_{i=1}^n(X_i-\bar X)^2 Xˉ=n1i=1nXi,S2=n11i=1n(XiXˉ)2
其他的统计量大多可以由总体数字特征直接置换样本矩得到。样本矩分为样本原点矩和中心矩,分别是
an,k=1n∑i=1nXik,mn,k=1n∑i=1n(Xi−Xˉ)k a_{n,k}=\frac1n\sum_{i=1}^nX_i^k, m_{n,k}=\frac1n\sum_{i=1}^n (X_i-\bar X)^k an,k=n1i=1nXik,mn,k=n1i=1n(XiXˉ)k
特别地,记Xˉ=an,1,Sn2=mn,2=(n−1)S2/n\bar X=a_{n,1},S_n^2=m_{n,2}=(n-1) S^2/nXˉ=an,1,Sn2=mn,2=(n1)S2/n

次序统计量是将样本从小到大排列以后,排列在第几个的样本就是其第几次序统计量,这包括最大值、最小值。

统计量也有两重性,当统计量作为随机变量时也有它的分布函数。

数理统计中,取统计量是为了估计分布族中的未知参数。分布族是一类分布构成的集合,如正态分布族、指数分布族等,它们都具有未知参数,所有可能取到的参数构成参数空间。

经验分布函数是Fn(x)=#{X1,⋯ ,Xn<x}F_n(x)=\#\{X_1,\cdots,X_n <x\}Fn(x)=#{X1,,Xn<x},即样本观测值中小于xxx的个数。格里汶科定理表明当n→∞n\to \inftyn时,Fn(x)F_n(x)Fn(x)以概率1收敛于F(x)F(x)F(x)

第二章

本章重点是数理统计中的常用分布与相关性质,包含正态分布、Γ\GammaΓ分布、B\BetaB分布、三大分布、ZZZ分布、次序统计量分布、指数族、充分完全统计量等。

正态分布是三大分布的基础,独立的正态随机变量可以经过线性组合变换成另一个正态随机变量,具体有以下定理(以下正态变量均独立):
Xk∼N(ak,σk2)⇒∑k=1nXk∼N(a,σ2),a=∑i=1nak,σ2=∑i=1nσk2X∼N(a,σ2)⇒nX∼N(na,n2σ2)X∼N(a,σ2)⇒Xˉ∼N(a,σ2/n) X_k\sim N(a_k,\sigma_k^2)\Rightarrow \sum_{k=1}^nX_k\sim N(a,\sigma^2),a=\sum_{i=1 }^na_k,\sigma^2=\sum_{i=1}^n \sigma_k^2\\ X\sim N(a,\sigma^2)\Rightarrow nX\sim N(na, n^2\sigma^2) \\ X\sim N(a,\sigma^2)\Rightarrow \bar X\sim N(a,\sigma^2/n) XkN(ak,σk2)k=1nXkN(a,σ2),a=i=1nak,σ2=i=1nσk2XN(a,σ2)nXN(na,n2σ2)XN(a,σ2)XˉN(a,σ2/n)
对于正态分布总体N(a,σ2)N(a,\sigma^2)N(a,σ2),其样本均值、样本方差有以下结论:

  1. Xˉ∼N(a,σ2/n)\bar X\sim N(a,\sigma^2/n)XˉN(a,σ2/n)
  2. (n−1)S2/σ2∼χn−12(n-1)S^2/\sigma^2\sim \chi^2_{n-1}(n1)S2/σ2χn12
  3. Xˉ,S2\bar X,S^2Xˉ,S2相互独立,这只对正态总体成立。

为了证明以上结论,常常构造一个正交矩阵A\boldsymbol AA
(1n1n1n⋯1n12⋅1−12⋅10⋯013⋅213⋅2−23⋅2⋯0⋯⋯⋯⋯⋯1n(n−1)1n(n−1)1n(n−1)⋯−(n−1)n(n−1)) \left( \begin{array}{c} \frac{1}{\sqrt n}&\frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\ \frac1{\sqrt {2\cdot 1}}&\frac{-1}{\sqrt {2\cdot1}}&0&\cdots&0\\ \frac1{\sqrt{3\cdot2}}&\frac1{\sqrt{3\cdot2}}&\frac{-2}{\sqrt {3\cdot2}}&\cdots&0\\ \cdots&\cdots&\cdots &\cdots&\cdots\\ \frac1{\sqrt {n(n-1)}}&\frac1{\sqrt {n(n-1)}}&\frac1{\sqrt {n(n-1)}}&\cdots&\frac{-(n-1)}{\sqrt{n(n-1)}} \end{array} \right) n1211321n(n1)1n1211321n(n1)1n10322n(n1)1n100n(n1)(n1)
然后利用Y=AX\boldsymbol Y=\boldsymbol {AX}Y=AX,可以证明得到2、3两个结论。


数理统计中常常用到两个欧拉积分以及相关变化,Γ\GammaΓ积分与B\BetaB积分如下:
Γ(α)=∫0∞xα−1e−xdxB(a,b)=∫01xa−1(1−x)b−1dx \Gamma(\alpha)=\int_0^\infty x^{\alpha-1}e^{-x}dx\\ \Beta(a,b)=\int_0^1 x^{a-1}(1-x)^{b-1}dx Γ(α)=0xα1exdxB(a,b)=01xa1(1x)b1dx
欧拉积分的相关变换还有
Γ(α+1)=αΓ(α)B(a,b)=∫01xa−1(1−x)b−1dx=x=t1+tt=x1−x∫0∞ta−1(1+t)−(a+b)dt=∫0∞xa−1(1+x)a+bdxB(a,b)=Γ(a)Γ(b)Γ(a+b) \begin{aligned} \Gamma(\alpha+1)=&\alpha\Gamma(\alpha) \\ \Beta(a,b)=&\int_0^1x^{a-1}(1-x)^{b-1}dx\\ {\xlongequal[x=\frac{t}{1+t}]{t=\frac{x}{1-x}}{}}&\int_0^\infty t^{a-1}(1+t)^{-(a+b)}dt\\ =&\int_0^\infty\frac{x^{a-1}}{(1+x)^{a+b}}dx\\ \quad\\ \Beta(a,b)=&\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)} \end{aligned} Γ(α+1)=B(a,b)=t=1xxx=1+tt=B(a,b)=αΓ(α)01xa1(1x)b1dx0ta1(1+t)(a+b)dt0(1+x)a+bxa1dxΓ(a+b)Γ(a)Γ(b)
基于此,有三种分布:Γ\GammaΓ分布、B\BetaB分布、ZZZ分布,其密度函数分别为:
Γ(α,λ)=λαΓ(α)xα−1e−λxI(0,∞)(x)B(a,b)=1B(a,b)xa−1(1−x)b−1I(0,1)(x)Z(a,b)=1B(a,b)xa−1(1+x)a+bI(0,∞)(x) \Gamma(\alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}I_{(0,\infty)}(x)\\ \Beta(a,b)=\frac{1}{\Beta(a,b)}x^{a-1}(1-x)^{b-1}I_{(0,1)}(x)\\ Z(a,b)=\frac1{\Beta(a,b)}\frac{x^{a-1}}{(1+x)^{a+b}}I_{(0,\infty)}(x) Γ(α,λ)=Γ(α)λαxα1eλxI(0,)(x)B(a,b)=B(a,b)1xa1(1x)b1I(0,1)(x)Z(a,b)=B(a,b)1(1+x)a+bxa1I(0,)(x)
三种分布的矩都可以通过欧拉积分变换求均值,分别为
E(Γ(α,λ))=αλ,E(B(a,b))=aa+b,E(Z(a,b))=ab−1 E(\Gamma(\alpha,\lambda))=\frac{\alpha}{\lambda},E(\Beta(a,b))=\frac a{a+b},E(Z(a,b))=\frac{a}{b-1} E(Γ(α,λ))=λα,E(B(a,b))=a+ba,E(Z(a,b))=b1a
三种分布的独立随机变量还满足以下一些关系:
X1∼Γ(α1,λ),X2∼Γ(α2,λ)⇒X1+X2∼Γ(α1+α2,λ)X1∼Γ(α1,λ),X2∼Γ(α2,λ)⇒X1X1+X2∼B(α1,α2)X1∼Γ(α1,λ),X2∼Γ(α2,λ)⇒X1X2∼Z(α1,α2)Y∼B(a,b)⇒Y1−Y∼Z(a,b)X∼Z(a,b)⇒X1+X∼B(a,b) X_1\sim \Gamma(\alpha_1,\lambda),X_2\sim \Gamma(\alpha_2,\lambda)\Rightarrow X_1+X_2\sim \Gamma(\alpha_1+\alpha_2,\lambda)\\ X_1\sim \Gamma(\alpha_1,\lambda),X_2\sim \Gamma(\alpha_2,\lambda)\Rightarrow \frac{X_1}{X_1+X_2}\sim \Beta(\alpha_1,\alpha_2)\\ X_1\sim \Gamma(\alpha_1,\lambda),X_2\sim \Gamma(\alpha_2,\lambda)\Rightarrow \frac{X_1}{X_2}\sim Z(\alpha_1,\alpha_2) \\ Y\sim \Beta(a,b)\Rightarrow \frac{Y}{1-Y}\sim Z(a,b)\\ X\sim Z(a,b)\Rightarrow \frac{X}{1+X}\sim \Beta(a,b) X1Γ(α1,λ),X2Γ(α2,λ)X1+X2Γ(α1+α2,λ)X1Γ(α1,λ),X2Γ(α2,λ)X1+X2X1B(α1,α2)X1Γ(α1,λ),X2Γ(α2,λ)X2X1Z(α1,α2)YB(a,b)1YYZ(a,b)XZ(a,b)1+XXB(a,b)


关于次序统计量,其密度函数可以由几何意义得出,这里写出几个常用的密度函数(分布函数),下设总体分布为F(x)F(x)F(x),总体密度为p(x)p(x)p(x)

X(k)X_{(k)}X(k)的密度函数为
pk(x)=n!(n−k)!(k−1)![F(x)]k−1[(1−F(x))]n−kp(x) p_k(x)=\frac{n!}{(n-k)!(k-1)!}[F(x)]^{k-1}[(1-F(x))]^{n-k}p(x) pk(x)=(nk)!(k1)!n![F(x)]k1[(1F(x))]nkp(x)
特别地对于最大最小值,有
p1(x)=np(x)[1−F(x)]n−1,F1(x)=1−[1−F(x)]npn(x)=np(x)[F(x)]n−1,Fn(x)=[F(x)]n p_1(x)=np(x)[1-F(x)]^{n-1},\quad F_1(x)=1-[1-F(x)]^{n}\\ p_n(x)=np(x)[F(x)]^{n-1},\quad F_n(x)=[F(x)]^n p1(x)=np(x)[1F(x)]n1,F1(x)=1[1F(x)]npn(x)=np(x)[F(x)]n1,Fn(x)=[F(x)]n
(X(i),X(j))(X_{(i)},X_{(j)})(X(i),X(j))的联合密度为
pi,j(xi,xj)=n!(xi−1)!(xj−xi−1)!(n−xj)![F(xi)]xi−1⋅[F(xj)−f(xi)]xj−xi−1[1−f(xj)]n−xjp(xi)p(xj)I(xi<xj) p_{i,j}(x_i,x_j)=\frac{n!}{(x_i-1)!(x_j-x_i-1)!(n-x_j)!}[F(x_i)]^{x_i-1}\cdot\\ [F(x_j)-f(x_i)]^{x_j-x_i-1}[1-f(x_j)]^{n-x_j}p(x_i)p(x_j)I(x_i<x_j) pi,j(xi,xj)=(xi1)!(xjxi1)!(nxj)!n![F(xi)]xi1[F(xj)f(xi)]xjxi1[1f(xj)]nxjp(xi)p(xj)I(xi<xj)
特别地对于(X(1),X(n))(X_{(1)},X_{(n)})(X(1),X(n)),有
p1,n(x,y)=n(n−1)[F(y)−F(x)]n−2p(x)p(y)I(x<y) p_{1,n}(x,y)=n(n-1)[F(y)-F(x)]^{n-2}p(x)p(y)I(x<y) p1,n(x,y)=n(n1)[F(y)F(x)]n2p(x)p(y)I(x<y)
(X(1),⋯ ,X(n))(X_{(1)},\cdots,X_{(n)})(X(1),,X(n))的联合密度为
p(x(1),⋯ ,x(n))=n!p(x(1))⋯p(x(n))I(x(1)<⋯<x(n)) p(x_{(1)},\cdots,x_{(n)})=n!p(x_{(1)})\cdots p(x_{(n)})I(x_{(1)}<\cdots<x_{(n)}) p(x(1),,x(n))=n!p(x(1))p(x(n))I(x(1)<<x(n))
对于均匀分布U(0,1)U(0,1)U(0,1),其极差分布为
pR(r)=n(n−1)rn−2(1−r)I(0<r<1) p_R(r)=n(n-1)r^{n-2}(1-r)I(0<r<1) pR(r)=n(n1)rn2(1r)I(0<r<1)


三大分布族指χ2\chi^2χ2分布、ttt分布与FFF分布,他们都是与正态分布相关的分布。

χn2\chi^2_nχn2分布是nnn个独立的N(0,1)N(0,1)N(0,1)变量和的分布,其密度函数为Γ(n/2,1/2)\Gamma(n/2,1/2)Γ(n/2,1/2)。其相关变形有
X∼Γ(n,λ)⇒2λX∼χ2n2X1∼χa2,X2∼χb2⇒X1+X2∼χa+b2 X\sim \Gamma(n,\lambda)\Rightarrow 2\lambda X\sim \chi^2_{2n}\\ X_1\sim \chi^2_{a},X_2\sim \chi^2_b\Rightarrow X_1+X_2\sim \chi^2_{a+b} XΓ(n,λ)2λXχ2n2X1χa2,X2χb2X1+X2χa+b2
ttt分布是N(0,1)N(0,1)N(0,1)χn2\chi^2_nχn2分布正则化后的比值,即
X∼N(0,1),Y∼χn2⇒T=XY/n∼tn X\sim N(0,1), Y\sim \chi^2_n\Rightarrow T=\frac{X}{\sqrt{Y/n}}\sim t_n XN(0,1),Yχn2T=Y/nXtn
FFF分布是两个正则化χ2\chi^2χ2分布的比值,即
X∼χm2,Y∼χn2⇒F=X/mY/n∼Fm,n X\sim \chi^2_m, Y\sim \chi^2_n\Rightarrow F=\frac{X/m}{Y/n}\sim F_{m,n} Xχm2,Yχn2F=Y/nX/mFm,n
三大分布都有其各自的分位数表,可以用来进行区间估计和假设检验。FFF分布在查表时还会用到以下用来求α\alphaα较接近1时的转换公式:
Fm,n(1−α)=1Fn,m(α) F_{m,n}(1-\alpha)=\frac1{F_{n,m}(\alpha)} Fm,n(1α)=Fn,m(α)1
正态分布的相关统计量中,也有与三大分布的关联。以下单样本时设X∼(a,σ2)X\sim(a,\sigma^2)X(a,σ2)样本个数为nnn;双样本时设X∼N(a1,σ12)X\sim N(a_1,\sigma_1^2)XN(a1,σ12)样本个数为mmmY∼N(a2,σ22)Y\sim N(a_2,\sigma_2^2)YN(a2,σ22)样本个数为nnn
∑i=1n(Xi−aσ)2∼χn2T=n(Xˉ−a)S∼tn−1F=S12S22σ22σ12∼Fm−1,n−1 \sum_{i=1}^n\left(\frac{X_i-a}{\sigma}\right)^2\sim \chi^2_n\\ \quad\\ T=\frac{\sqrt n(\bar X-a)}{S}\sim t_{n-1}\\ \quad\\ F=\frac{S_1^2}{S_2^2}\frac{\sigma_2^2}{\sigma_1^2}\sim F_{m-1,n-1} i=1n(σXia)2χn2T=Sn(Xˉa)tn1F=S22S12σ12σ22Fm1,n1


指数族是一系列具有特殊形式样本密度函数(概率分布列)的参数分布族,如果可以将联合密度函数写成如下形式:
f(x)=C(θ)exp⁡{∑i=1kQi(θ)Ti(x)}h(x) f(\boldsymbol x)=C(\theta)\exp\left\{ \sum_{i=1}^kQ_i(\theta)T_i(\boldsymbol x) \right\}h(\boldsymbol x) f(x)=C(θ)exp{i=1kQi(θ)Ti(x)}h(x)
指数族拥有良好的性质,最典型的是指数分布族拥有共同的支撑集,因此U(0,θ)U(0,\theta)U(0,θ)显然不是指数族。而正态分布族、二项分布族、Gamma分布族、泊松分布族等都是指数族。

在指数族的形式中,如果令φi=Qi(θ)\varphi_i=Q_i(\theta)φi=Qi(θ),将f(x;θ)f(\boldsymbol x;\theta)f(x;θ)改写成f(x;φ)f(\boldsymbol x;\varphi)f(x;φ),就得到指数族的自然形式如下:
f(x)=C∗(φ)exp⁡{∑i=1kφiTi(x)}h(x) f(\boldsymbol x)=C^*(\varphi)\exp\left\{ \sum_{i=1}^k\varphi_iT_i(\boldsymbol x) \right\}h(\boldsymbol x) f(x)=C(φ)exp{i=1kφiTi(x)}h(x)
指数族的自然参数空间为凸集;指数族求导可以在积分号下求导,且可以求任意阶导数。


充分统计量指的是蕴含样本中所有关于未知参数信息的统计量,即在已知TTT的条件下,样本的条件分布与未知参数θ\thetaθ无关。对于离散情形,要验证P(X∈A∣T)\mathbf P(\boldsymbol X\in A|T)P(XAT)θ\thetaθ无关;对于连续情形,要验证p(x∣T)p(\boldsymbol x|T)p(xT)θ\thetaθ无关,这里
P(X∈A∣T=t)=P(X∈A,T=t)P(T=t)p(x∣t)=p(x,t)p(t) \mathbf P(\boldsymbol X\in A|T=t)=\frac{P(\boldsymbol X\in A,T=t)}{P(T=t)}\\ p(\boldsymbol x|t)=\frac{p(x,t)}{p(t)} P(XAT=t)=P(T=t)P(XA,T=t)p(xt)=p(t)p(x,t)
用定义验证统计量的充分性是麻烦的,如果可以将样本的联合密度函数写成
p(x;θ)=g(T(x),θ) p(\boldsymbol x;\theta)=g(T(\boldsymbol x),\theta) p(x;θ)=g(T(x),θ)
的形式,则T(X)T(\boldsymbol X)T(X)是充分统计量,这是因子分解定理。

完备统计量指的是对于某一个统计量TTT,对任何满足E(φ(T))=0E(\varphi(T))=0E(φ(T))=0都能推出φ=0\varphi=0φ=0以概率1成立。要证明统计量的完备性,一般会写出E(φ(T))E(\varphi(T))E(φ(T))的离散和式或连续积分式,然后比较未知参数的系数或者对未知参数求导,从而得到φ=0\varphi=0φ=0

在指数族的自然形式中,分布函数为
f(x;θ)=C(θ)exp⁡{∑i=1kθiTi(x)}h(x) f(\boldsymbol x;\theta)=C(\theta)\exp\left\{ \sum_{i=1 }^k\theta_iT_i(\boldsymbol x) \right\}h(\boldsymbol x) f(x;θ)=C(θ)exp{i=1kθiTi(x)}h(x)
θ\thetaθ的自然参数空间Θ∗\Theta^*Θ中,如果其作为Rk\R^kRk的子集有内点,则T(X)=(T1(X),⋯ ,Tk(X))\boldsymbol T(\boldsymbol X)=(T_1(\boldsymbol X),\cdots,T_k(\boldsymbol X))T(X)=(T1(X),,Tk(X))是完全统计量;如果h(x)=1h(\boldsymbol x)=1h(x)=1,则它还是充分统计量。

要证明某个统计量不是完备的,就要找到一个函数φ≠0\varphi\neq0φ=0,但E(φ(T))=0E(\varphi(T))=0E(φ(T))=0

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值