机敏问答[概率][5] #20210619
本专栏主要作个人复习自测,有相关知识预备的同学也可作复习用。不保证无相应基础的人士能看明白。
万一考试考到了,或者对你的学习有较大帮助,一键三连不过分吧(斜眼笑)
Bernoulli试验场合极限定理
- 对于Bernoulli实验,什么是标准化后的(和) S n ∗ S_n^* Sn∗?
- Bernoulli大数律:用()不等式估计 P ( ∣ S n − n p n ∣ ≥ ϵ ) ≤ P(|\frac{S_n-np}{n}|\ge\epsilon)\le P(∣nSn−np∣≥ϵ)≤()。左边分母换成()时恰好就不能说明()(收敛种类)收敛了。
- De Moivre-Laplace中心极限定理:如何处理后的 S n S_n Sn满足什么分布?
- 解释 P ( S n = k ) p Z ( x k ) Δ x \frac{P(S_n=k)}{p_Z(x_k)\Delta x} pZ(xk)ΔxP(Sn=k)在 K \mathbb K K上一致收敛到1这个命题中各个字母含义。
答案
- S n − n p n p q \frac{S_n-np}{\sqrt{npq}} npqSn−np
- 切比雪夫, n − 2 ⋅ n v a r ( X ) ϵ 2 \frac{n^{-2}\cdot n var(X)}{\epsilon^2} ϵ2n−2⋅nvar(X), n \sqrt n n,依概率
- 标准化,标准正态分布。
- S n ∼ B ( n , p ) , Z ∼ N ( 0 , 1 ) , x k = k − n p n p q , Δ x = x k + 1 − x k = 1 n p q S_n\sim B(n,p),Z\sim N(0,1),x_k=\frac{k-np}{\sqrt{npq}},\Delta x=x_{k+1}-x_k=\frac 1{\sqrt{npq}} Sn∼B(n,p),Z∼N(0,1),xk=npqk−np,Δx=xk+1−xk=npq1, K \mathbb K K是区间(不一定有限)
依概率收敛和WLLN
- 依概率收敛的本质思想:()时概率小,()时误差小。
- r r r阶收敛 ξ n → r ξ \xi_n\mathop\to\limits^r\xi ξn→rξ:()(表达式)极限为0. 其中 r r r满足条件()
- 上面两种收敛是什么关系?(用到()不等式)其中不成立的一边和数学分析中不一致收敛的函数的积分有何关系?
- 弱大数律的结果是()(收敛种类)收敛,过程中(使用矩法证明时)用到了()(收敛种类)收敛。其中切比雪夫WLLN是两两()随机变量且所有随机变量满足条件:()。马尔可夫WLLN不需要独立性,也不考虑每个随机变量的()(数字特征),但是考虑()(随机变量)的()(数字特征)的渐近行为是()(填关于 n n n的量级)。
- 3.中所说收敛指的是()(表达式)依概率收敛到0. 如果需要 S n / n S_n/n Sn/n收敛到一个常数,我们额外需要的收敛性是(),这个收敛是什么意思?
- 用多项式逼近闭区间上连续函数:简单来说,每个点 x x x处的多项式函数值是以()为参数的()分布的概率值。
- ()收敛定理:几乎处处()(填条件)和()(收敛种类)收敛可以推出期望收敛。本质是分两段放缩(和数学分析哪里有类似处?)
- 截断情况推出 S n / n − E X 1 { ∣ X ∣ ≤ n } S_n/n-EX1_{\{|X|\le n\}} Sn/n−EX1{∣X∣≤n}依概率收敛至0:充分条件是()(含有概率的表达式)关于 x → ∞ x\to\infty x→∞极限趋于0. 则构造一列随机变量列(即构造”三角形“),截断的阈值依次(),且截断”造成影响“的概率趋于()。
- 7.中题设条件除了用于考察截断造成影响的概率,还在考察()的方差时作为被积函数(回忆阿贝尔变换)
- 7.中题设条件可以由 E ∣ X ∣ E|X| E∣X∣满足()推出,而7.中结论结合控制收敛定理就证明了 S n / n → P E X S_n/n\mathop\to\limits^PEX Sn/n→PEX.
- 应用:水浒传 n n n将集卡问题。 根据几何分布,已经有 k k k将的卡时集下一张所需的抽取次数的期望在()(关于 n , k n,k n,k)量级,方差不超过()量级。(总需要抽取数)变量之和的期望和方差渐近行为分别是()(关于 n n n)量级,其中特别注意()( n n n的函数)是()( n n n的函数)的平方的高阶小,于是再回忆4.,就得到集齐 n n n张卡所需的次数在 n n n趋于无穷时满足依概率收敛式()。
- 集齐一半卡需要抽取多少次?
答案
- 误差大,概率大
- E ∣ ξ n − ξ ∣ r E|\xi_n-\xi|^r E∣ξn−ξ∣r, > 0 >0 >0
- r r r阶收敛是依概率收敛的充分不必要条件。马尔可夫(或:切比雪夫)。可以用类似的反例(反例的本质也有类似之处)。
- 依概率, r r r阶,无关,方差一致有界,方差,和 S n S_n Sn,方差(关于 n n n), o ( n 2 ) o(n^2) o(n2)
- ( S n − E S n ) / n (S_n-ES_n)/n (Sn−ESn)/n, E S n / n → a ES_n/n\to a ESn/n→a,数列的收敛
- x x x,( n n n很大)二项
- 有界,有界,依概率。例:黎曼可积的一个充分条件。
- x P ( ∣ X ∣ > x ) xP(|X|>x) xP(∣X∣>x),增大,0
- 截断变量 X 1 { ∣ X ∣ ≤ n } X1_{\{|X|\le n\}} X1{∣X∣≤n}
- < ∞ <\infty <∞
- n n − k \frac{n}{n-k} n−kn, n 2 / ( n − k ) 2 n^2/(n-k)^2 n2/(n−k)2, n l n n , n 2 nlnn, n^2 nlnn,n2, n 2 n^2 n2, n l n n nlnn nlnn, S n / ( n l n n ) → P 1 S_n/(nlnn)\mathop\to\limits^P1 Sn/(nlnn)→P1
- 注意:此时 n 2 / ( n − k ) 2 n^2/(n-k)^2 n2/(n−k)2求和只需要 k k k小的那些项,这样的 n / 2 n/2 n/2项和在 n n n趋于无穷时趋于0. 结果是 T n / ( n l n 2 ) → P 1 T_n/(nln2)\mathop\to\limits^P1 Tn/(nln2)→P1
几乎必然收敛
- ”风水轮流转“,在数学分析中点点收敛总是被认为很弱,而这里的()比点点收敛还弱却被认为很强。
- 某个样本点处随机变量列不收敛其实就是()(填数列)不收敛。用 ϵ − \epsilon- ϵ−语言叙述为(),把 ϵ \epsilon ϵ换成一列正数则叙述为(),用集合的可数次运算通过 A n , ϵ = { ∣ ξ n − ξ ∣ > ϵ } A_{n,\epsilon}=\{|\xi_n-\xi|>\epsilon\} An,ϵ={∣ξn−ξ∣>ϵ}表示 { ω ∣ ξ n ( ω ) → ξ ( ω ) } c \{\omega| \xi_n(\omega)\to\xi(\omega)\}^c {ω∣ξn(ω)→ξ(ω)}c就是()。上面表达式如果改写成为 ∪ k ≥ 1 A 1 / k = l i m k → ∞ A 1 / k \cup_{k\ge 1}A_{1/k}=lim_{k\to\infty}A_{1/k} ∪k≥1A1/k=limk→∞A1/k,那么 A ϵ A_\epsilon Aϵ在这里是什么含义?
- Borel-Cantelli引理:任何情况下,如果一列事件概率和满足条件(),则这列事件几乎不可能()发生。如果相互独立且概率和满足条件(),则()。i.o.相当于几层什么集合运算?
- 第一引理证明:回忆1.中最外层的()(集合运算)可以写成极限运算,这里的外层()(集合运算)也可以写成极限运算。(再利用收敛级数的性质)
- 第二引理证明:相互独立事件的概率等于各事件概率(),再用()(填不等式)放缩。
- 总结: ξ n → a . s . ξ \xi_n\mathop\to\limits^{a.s.}\xi ξn→a.s.ξ的充要条件:几乎必然收敛定义是()的概率为1,通过 ϵ − \epsilon- ϵ−语言转化为任意()(希腊字母),有()(事件)i.o.发生概率为()。简述刚才最后一个充要条件为什么可以等价于 P ( ∪ n ≥ N A n , ϵ ) P(\cup_{n\ge N}A_{n,\epsilon}) P(∪n≥NAn,ϵ)单调趋于0?
- 用3. 5.写出一个充分条件。
答案
- 几乎处处收敛。
- 数列, ∃ ϵ > 0 , ∀ N , ∃ n > N , s . t . ∣ ξ n − ξ ∣ > ϵ \exists\epsilon>0,\forall N,\exists n>N,s.t.|\xi_n-\xi|>\epsilon ∃ϵ>0,∀N,∃n>N,s.t.∣ξn−ξ∣>ϵ, ∃ 1 / k > 0 , ⋯ \exists 1/k>0,\cdots ∃1/k>0,⋯, ∪ k ≥ 1 ∩ N ≥ 1 ∪ n > N A n , 1 / k \cup_{k\ge 1}\cap_{N\ge1}\cup_{n> N}A_{n,1/k} ∪k≥1∩N≥1∪n>NAn,1/k. 直观含义是不收敛且”震荡幅度“大于 ϵ \epsilon ϵ.
- 收敛,无穷次(i.o.),发散,几乎一定i.o.发生。两层,内并外交。
- 并,交。
- 乘积, 1 − x < e − x 1-x<e^{-x} 1−x<e−x.
- 略, ϵ \epsilon ϵ, A n , ϵ = { ∣ ξ n − ξ ∣ > ϵ } A_{n,\epsilon}=\{|\xi_n-\xi|>\epsilon\} An,ϵ={∣ξn−ξ∣>ϵ},0。必要性:单调显然,而如果 P ( ∪ n ≥ N A n , ϵ ) P(\cup_{n\ge N}A_{n,\epsilon}) P(∪n≥NAn,ϵ)有非零极限则那些能……的样本的点也是能……的样本点。充分性:那些让 A n , ϵ A_{n,\epsilon} An,ϵi.o.发生的样本点也是……的样本点。
- ∑ n P ( A n , ϵ ) < ∞ , ∀ ϵ > 0 \sum_nP(A_{n,\epsilon})<\infty,\forall \epsilon>0 ∑nP(An,ϵ)<∞,∀ϵ>0
几乎必然收敛与其它收敛
- 依概率收敛用之前记号 A n , ϵ A_{n,\epsilon} An,ϵ表示为()。所以几乎必然收敛能推出()(收敛种类)。
- 为什么 r r r阶收敛和几乎必然收敛两边各不推出?
- 通过B-C第()(序号)引理,通过设法取“误差大”的概率满足条件()的随机变量列,可以说明()(收敛种类)收敛的随机变量列的任意子列存在子列的子列(下称“子子列“)使得()(收敛种类)收敛。
- 如果一个数列的任意子列都存在子子列收敛到0,则()。如果一个随机变量列不是依概率收敛的,则存在一个子列使得()(用 A n , ϵ A_{n,\epsilon} An,ϵ表示),该子列的任意子子列都不是几乎必然收敛到 ξ \xi ξ的。故依概率收敛等价于()。
- 前述有界收敛定理的题设是()(收敛种类)收敛,结论是()(研究对象。随机变量?分布?还是什么)的收敛,但是()作为数字特征,实际上只和分布有关。所以我们可以通过考察和原始的 ξ n , ξ \xi_n,\xi ξn,ξ()(研究对象)相同的随机变量 η n , η \eta_n,\eta ηn,η之间的收敛性考察依分布收敛能否得到有界收敛定理。
- 接上。具体地,请证明 F ξ n − 1 ( U ) F_{\xi_n}^{-1}(U) Fξn−1(U)和 ξ n \xi_n ξn同分布。而 ξ n \xi_n ξn依分布收敛到 ξ \xi ξ可以推出()(谁哪种收敛到谁)就证明了待求结论(依分布收敛的有界收敛定理)。
答案
- ∀ ϵ , l i m n P ( A n , ϵ ) → 0 \forall \epsilon, lim_nP(A_{n,\epsilon})\to0 ∀ϵ,limnP(An,ϵ)→0(注:和几乎必然收敛的一个充分条件对比:就是级数收敛和级数项趋于0的关系),依概率收敛(注:考察上一节5.)。
- 提示:“轮流偏离”则不几乎必然收敛(实际上,必然不收敛)。“不一致收敛”则不 r r r阶收敛(类似数学分析反例。
- 一,求和收敛,依概率,几乎必然。
- 该数列收敛到0, A n k , ϵ 0 > δ 0 , ∀ k A_{n_k,\epsilon_0}>\delta_0,\forall k Ank,ϵ0>δ0,∀k,任意子列有几乎必然收敛的子子列
- 依概率,期望(数列),期望,分布
- P ( F ξ − 1 ( U ) ≤ x ) = P ( U ≤ F ξ ( x ) ) = P ( ξ ≤ x ) P(F_{\xi}^{-1}(U)\le x)=P(U\le F_\xi(x))=P(\xi\le x) P(Fξ−1(U)≤x)=P(U≤Fξ(x))=P(ξ≤x), F ξ n − 1 ( U ) F_{\xi_n}^{-1}(U) Fξn−1(U)几乎必然收敛到 F ξ − 1 ( U ) F_\xi^{-1}(U) Fξ−1(U)
SLLN
- 强大数律是让 S n − E S n n \frac{S_n-ES_n}n nSn−ESn()(收敛种类)到()。最容易证明的一种是()阶矩有限的情况,此时 S n S_n Sn的()阶矩直接展开并利用变量之间()(性质)和()(人名)不等式直接得到渐近行为是()(关于 n n n)量级。为了把渐近行为从()量级变成求和收敛的()量级,需要()阶矩!
- 更强的:对于独立同分布(标准化后)且2阶矩有限的情况,虽然 P ( A n , ϵ ) = P ( ∣ S n / n ∣ > ϵ ) P(A_{n,\epsilon})=P(|S_n/n|>\epsilon) P(An,ϵ)=P(∣Sn/n∣>ϵ)关于 n , ϵ n,\epsilon n,ϵ的量级是求和发散的(),但是()(事件的概率)的量级是求和收敛的()。所以说已知一个子列()(通项公式)满足 S n m / n m S_{n_m}/{n_m} Snm/nm()
- 对于上述子列以外的部分,我们考察 P ( X m 2 + 1 + ⋯ + X m 2 + k m 2 ) P(\frac{X_{m^2+1}+\cdots+X_{m^2+k}}{m^2}) P(m2Xm2+1+⋯+Xm2+k),利用()不等式估计其不超过()(关于 m m m)量级,而 n m + 1 − n m n_{m+1}-n_m nm+1−nm是()量级,综合起来有 m a x k ∣ X m 2 + 1 + ⋯ + X m 2 + k ∣ max_k|X_{m^2+1}+\cdots+X_{m^2+k}| maxk∣Xm2+1+⋯+Xm2+k∣不超过()量级,所以考察 ∣ S n ∣ ≤ m a x ∣ X m 2 + 1 + ⋯ + X m 2 + k ∣ + |S_n|\le max|X_{m^2+1}+\cdots+X_{m^2+k}|+ ∣Sn∣≤max∣Xm2+1+⋯+Xm2+k∣+()(随机变量),右边两项都是除以 n n n后()(收敛种类)到0的,则根据定义显然有 S n / n S_n/n Sn/n()
- Kolmogorov’s SLLN:()(随机变量间性质)且()(数字特征)小于无穷,则()。请考察 S n / n S_n/n Sn/n存在的一切样本点,证明这些样本点处 X n / n X_n/n Xn/n极限为()。
- 反之,若 X n / n X_n/n Xn/n几乎必然收敛到0(各 X i X_i Xi独立同分布,要区别于 X / n X/n X/n),则根据()(人名)变换和用离散型随机变量的期望估计一般情况,马上得到()(关于期望的结论)。(其中用到()引理)
- 如果把3.中期望满足条件改成 E X = ∞ EX=\infty EX=∞,那么想证明()(类比,写出要证的结论)。不失一般性设 X X X非负,设 T n T_n Tn是 n n n个截断随机变量()的和,其中截断的阈值是给定的,则根据()(定理),有()(随机变量)几乎必然收敛到 E ( m i n ( X , M ) ) E(min(X,M)) E(min(X,M)). 根据任意 M M M都有 S n ≥ T n S_n\ge T_n Sn≥Tn,马上得到任意 M M M都有()(随机变量)在 n → ∞ n\to\infty n→∞时的()(极限种类)几乎必然大于等于()。
- 根据()(满足一定条件的事件)的交仍是()(满足一定条件的事件),我们现在只需证明()(数字特征)在 M M M()(满足条件)时能趋于无穷即可。这直接用()(人名)变换考察 E X = ∞ EX=\infty EX=∞即可。
- 什么是独立同分布数据的样本均值?其(在期望存在时)为什么几乎必然收敛到()?对于二阶矩存在时样本方差呢?
- 利用SLLN说明如何用均匀随机变量 U ∼ U ( 0 , 1 ) U\sim U(0,1) U∼U(0,1)做高维数值积分。
- 对于 f , g : [ 0 , 1 ] → R f,g:[0,1]\to\mathbb R f,g:[0,1]→R, 0 ≤ f < C g 0\le f<Cg 0≤f<Cg,求 l i m n → ∞ ∫ 高 维 正 方 体 ∑ i f ( x i ) / ∑ i g ( x i ) d x 1 ⋯ d x n lim_{n\to\infty}\int_{高维正方体}\sum_i f(x_i)/{\sum_i g(x_i)}dx_1\cdots dx_n limn→∞∫高维正方体∑if(xi)/∑ig(xi)dx1⋯dxn,我们相当于构造随机变量 X i = X_i= Xi=()和() = = =(),定义部分和()(自行定义记号),则原积分就是随机变量 W n = W_n= Wn=()的期望。
- 接上,利用()(收敛种类)保持四则运算,说明 W n = W_n= Wn=()(定义的恒等变形)几乎必然收敛到()(随机变量的数字特征) = ∫ 0 1 f d x / ∫ 0 1 g d x : = w =\int_0^1fdx/{\int_0^1gdx}:=w =∫01fdx/∫01gdx:=w. 然而我们要求的是期望,而不是随机变量的极限,所以还要用()(定理名)定理。
答案
- 几乎必然收敛,0,4,4,独立性,柯西-施瓦尔茨, n 2 n^2 n2, n 2 n^2 n2, n − 2 n^{-2} n−2,4
- n − 1 ϵ − 2 n^{-1}\epsilon^{-2} n−1ϵ−2, P ( A n 2 , ϵ ) P(A_{n^2,\epsilon}) P(An2,ϵ), n − 2 ϵ − 2 n^{-2}\epsilon^{-2} n−2ϵ−2, n m = m 2 n_m=m^2 nm=m2,关于 m m m几乎必然收敛到0.
- 切比雪夫, m − 3 m^{-3} m−3(忽略 ϵ \epsilon ϵ相关的量级,视为 O ( 1 ) O(1) O(1)), m m m, m − 2 m^{-2} m−2, ∣ S m 2 ∣ |S_{m^2}| ∣Sm2∣,几乎必然收敛,几乎必然收敛到0
- 独立同分布, E ∣ X ∣ E|X| E∣X∣, S n / n → a . s . E X S_n/n\mathop\to\limits^{a.s.}EX Sn/n→a.s.EX,0. 提示:相邻两项相减。
- 阿贝尔, E ∣ X ∣ = ∞ E|X|=\infty E∣X∣=∞,B-C第二
- S n / n S_n/n Sn/n几乎必然收敛到无穷, m i n ( X i , M ) min(X_i,M) min(Xi,M),SLLN, T n / n T_n/n Tn/n, S n / n S_n/n Sn/n,下极限, E ( m i n ( X , M ) ) E(min(X,M)) E(min(X,M))
- 概率为1事件,概率为1事件, E ( m i n ( X , M ) ) E(min(X,M)) E(min(X,M)),趋于无穷,阿贝尔。
- S n / n S_n/n Sn/n, E X EX EX, 1 n ∑ i ( X i − X ˉ ) 2 \frac 1n\sum_i(X_i-\bar X)^2 n1∑i(Xi−Xˉ)2几乎必然收敛到 v a r ( X ) var(X) var(X)
- 理论上, ∫ 0 1 f ( x ) d x = E f ( U ) \int_0^1 f(x)dx=Ef(U) ∫01f(x)dx=Ef(U);实际中, 1 n ∑ f ( U i ) \frac 1n\sum f(U_i) n1∑f(Ui)几乎必然收敛到 ∫ 0 1 f d x \int_0^1 fdx ∫01fdx. 高维略。
- f ( U i ) f(U_i) f(Ui), Y i Y_i Yi, g ( U i ) g(U_i) g(Ui),略,略, S n / T n S_n/T_n Sn/Tn
- 几乎必然收敛, S n / n T n / n \frac{S_n/n}{T_n/n} Tn/nSn/n, E X / E Y EX/EY EX/EY,有界收敛。
这篇博客深入探讨了概率论中的Bernoulli试验场合的极限定理,包括依概率收敛、WLLN、几乎必然收敛等概念,并通过实例解释了De Moivre-Laplace中心极限定理。文章还讨论了弱大数定律、切比雪夫不等式及其在数据分析和随机变量收敛性证明中的应用。此外,内容涵盖了数据收集、分布和期望的收敛性质,以及在实际问题如集卡问题中的应用。

3323

被折叠的 条评论
为什么被折叠?



