概率论
基础
对于一个在闭区间 \(I=[a,b]\) (\(a,b\) 可为无穷) 上一致有界 \([A,B]\) 的非降函数 \(F\), 其不连续点是跳跃点, 数量是至多可数的, 并且可以用 Riemann 积分定义以它为测度的积分 (这门课里只用考虑这个):
\[\int_If(x)\mathrm dF(x)
\]
在跳跃点将会产生一个恒定的变差, 所以 Riemann 积分的定义难以使用, 意会即可. 积分不一定收敛或存在, 但是其 Fourier-Stieltjes 变换一定存在且连续:
\[\varphi_F\colon
\mathbb R\to\mathbb C,
t\mapsto\int_I\exp(\mathrm itx)\mathrm dF(x)
\]
有接下来最重要的不等式, 叫做三角积分不等式:
\[|\int_If(x)\mathrm dF(x)|
\le\int_I|f(x)|\mathrm dF(x)
\]
收敛
考虑一个一致有界非降函数列 \(\{F_k\colon I\to[A,B]\}_{k=0}^{+\infty}\), 因为可数个至多可数集的并是至多可数的, 所以在每个函数上均连续的点是稠密的, 一般只需关心其连续点.
称其弱收敛于有界非降函数 \(F\colon I\to[A,B]\), 当且仅当对任意连续点 \(x\in I\) 有 \(\lim_{n\to+\infty}F_n(x)=F(x)\), 并记作 \(F_n\xrightarrow{\mathrm W}F\).
取连续点中一个可数的稠密集并排成列 \(\{r_k\in I\}_{k=0}^{+\infty}\), 考虑通过逐点筛选出子列使它在每个连续点上均收敛. 令 \(\{F_{0,n}=F_n\}_{n=0}^{+\infty}\), 再 \(\forall k\in\mathbb N\), 因为 \(\{F_{k,n}(r_k)\}_{n=0}^{+\infty}\) 所有点都在紧集 \([A,B]\) 中, 所以可以选出一个收敛到 \([A,B]\) 中元素 \(F_k\) 的收敛子列, 并记其对应的函数列为 \(\{F_{k+1,n}\}_{n=0}^{+\infty}\).
最后取对角线 \(\{F_{n,n}\}_{n=0}^{+\infty}\), 则 \(\forall k\in\mathbb N\), 这个函数列去掉前 \(k+1\) 项后剩下的元素均在 \(\{F_{k+1,n}\}_{n=0}^{+\infty}\) 中, 故该函数列在 \(r_k\) 处收敛. 最后定义函数:
\[F\colon
I\to[A,B],
x\mapsto\sup_{r_k\le x}F_k
\]
则可以验证这个函数单调不降, 左连续, 且 \(F_n\xrightarrow{\mathrm W}F\). 这是 Helly 第一定理.
若 \(f\colon I\to\mathbb C\) 有界连续而 \(F_n\xrightarrow{\mathrm W}F\), 考虑:
\[\lim_{n\to+\infty}\int_If(x)\mathrm dF_n(x)
=\int_If(x)\mathrm dF(x)
\]
是否成立. 答案是不一定, 但主要是端点不连续时不被弱收敛限制的问题, 事实上总有:
\[\liminf_{n\to+\infty}F_n(a)
\le\limsup_{x\to a+}\liminf_{n\to+\infty}F_n(x)
=\limsup_{x\to a+}F(x)
=F(a+)
\]
\[\limsup_{n\to+\infty}F_n(b)
\ge\liminf_{x\to b-}\limsup_{n\to+\infty}F_n(x)
=\liminf_{x\to b-}F(x)
=F(b-)
\]
只需要再加上 \(\lim_{n\to+\infty}F_n(a)=F(a),\lim_{n\to+\infty}F_n(b)=F(b)\) 即可. \(I\) 有界的情况下 \(f\) 一致连续, 所以分成若干个以连续点为端点的段, 再不断细分即可逼近. 这叫做 Helly 第二定理.
一般要考虑 \(I\) 无界即 \(a=-\infty\) 或 \(b=+\infty\) 的情况, 不妨直接考虑 \(I=(-\infty,+\infty)\), 此时根据定义直接有 \(F(a-)=F(a),F(b+)=F(b)\).
首先因为单调有界, 所以 \(F_n(a)=F_n(-\infty),F(a)=F(-\infty)\) 以及 \(F_n(b)=F_n(+\infty),F(b)=F(+\infty)\) 总是良定义的. 事实上:
再把整个积分分成 \((-\infty,l),[l,r],(r,+\infty)\) 三段, 通过 \(f\) 有界和调整 \(l,r\) 来控制左右两段的上界, 再用 Helly 第二定理的方法控制中间这段的值即可. 这叫做 拓广 Helly 第二定理.
Fourier-Stieltjes 变换是非常有用的. \(\forall x_1,x_2\in I,x_1<x_2\) 时:
\[\lim_{T\to+\infty}\frac1{2\pi}\int_{-T}^T\frac{\exp(-\mathrm itx_1)-\exp(-\mathrm itx_2)}{\mathrm it}\varphi_F(t)\mathrm dt
\]
\[=\lim_{T\to+\infty}\frac1{2\pi}\int_{-T}^T\frac{\exp(-\mathrm itx_1)-\exp(-\mathrm itx_2)}{\mathrm it}(\int_I\exp(\mathrm itx)\mathrm dF(x))\mathrm dt
\]
根据 Fubini 定理:
\[=\int_I(\lim_{T\to+\infty}\frac1{2\pi}\int_{-T}^T\frac{\exp(-\mathrm it(x_1-x))-\exp(-\mathrm it(x_2-x))}{\mathrm it}\mathrm dt)\mathrm dF(x)
\]
再根据 Euler 公式, \(\sin\) 的奇性和 \(\cos\) 的偶性:
\[=\lim_{T\to+\infty}\int_I(\frac1\pi(\int_0^T\frac{\sin(t(x-x_1))}t\mathrm dt-\int_0^T\frac{\sin(t(x-x_2))}t\mathrm dt))\mathrm dF(x)
\]
中间根据数分三是 Dirichlet 核, 它在 \(T\to+\infty\) 时条件收敛到:
\[H_{x_1,x_2}\colon
\mathbb R\to\mathbb R,
x\mapsto\frac{\operatorname{sgn}(x-x_1)-\operatorname{sgn}(x-x_2)}2=\begin{cases}1&x_1<x<x_2\\\frac12&x=x_1\vee x=x_2\\0&x<x_1\vee x>x_2\\
\end{cases}
\]
所以可以换序, 且:
\[=\int_IH_{x_1,x_2}(x)\mathrm dF(x)
=\int_{x_1}^{x_2}\mathrm dF(x)+\frac12(F(x_2+)-F(x_2-))+\frac12(F(x_1+)-F(x_1-))
\]
\[=F(x_2-)-F(x_1+)+\frac12(F(x_2+)-F(x_2-))+\frac12(F(x_1+)-F(x_1-))
\]
\[=\frac{F(x_2-)+F(x_2+)}2-\frac{F(x_1-)+F(x_1+)}2
\]
这叫做 Lévy 反演公式. 只要 \(F\) 在 \(x_1,x_2\) 处连续那么就是 \(F(x_2)-F(x_1)\), 由连续点稠密性即可还原出 \(F\). 所以一致有界非降函数与其 Fourier-Stieltjes 变换一一对应.
下面均只考虑 \(I=\mathbb R\).
回到函数列, 在拓广 Helly 第二定理的条件下直接有:
\[\forall x\in\mathbb R,
\lim_{n\to+\infty}\varphi_{F_n}(x)=\varphi_F(x)
\]
考虑倒过来是否成立. 这里只考虑 \(I=\mathbb R\), 选足够小的 \(\tau>0\) 估计:
\[\frac1{2\tau}|\int_{-\tau}^\tau\varphi_{F_n}(t)\mathrm dt|
=\frac1{2\tau}|\int_{-\tau}^\tau\mathrm dt\int_I\exp(\mathrm itx)\mathrm dF_n(x)|
\]
根据 Fubini 定理:
\[=\frac1{2\tau}|\int_I\mathrm dF_n(x)\int_{-\tau}^\tau\exp(\mathrm itx)\mathrm dt|
=\frac1{2\tau}|\int_I\frac{\exp(\mathrm i\tau x)-\exp(-\mathrm i\tau x)}{\mathrm ix}\mathrm dF_n(x)|
=\frac1\tau|\int_I\frac{\sin\tau x}x\mathrm dF_n(x)|
\]
根据三角积分不等式, 再利用 \(\sin\), 选足够大的连续点 \(X>0\) 估计:
\[\le\frac1\tau\int_I|\frac{\sin\tau x}x|\mathrm dF_n(x)
=\frac1\tau\int_{I,|x|\le X}|\frac{\sin\tau x}x|\mathrm dF_n(x)+\frac1\tau\int_{I,|x|>X}|\frac{\sin\tau x}x|\mathrm dF_n(x)
\]
\[\le\int_{I,|x|\le X}\mathrm dF_n(x)+\frac1\tau\int_{I,|x|>X}\frac1X\mathrm dF_n(x)
\le F_n(X)-F_n(-X)+\frac{B-A}{X\tau}
\]
左右取 \(n\to+\infty\), 这里还不知道 \(F_n\) 是否弱收敛, 需要用 Helly 第一定理求一个子列 \(\{F_{k_n}\}_{n=0}^{+\infty}\) 使得 \(F_{k_n}\xrightarrow{\mathrm W}F\):
\[\frac1{2\tau}|\int_{-\tau}^\tau\varphi_F(t)\mathrm dt|
\le\liminf_{n\to+\infty}(F_{k_n}(X)-F_{k_n}(-X))+\frac{B-A}{X\tau}
=F(X)-F(-X)+\frac{B-A}{X\tau}
\]
另一方面, 条件保证着 \(\varphi_F(0)=\lim_{n\to+\infty}\varphi_{F_{k_n}}(0)=\lim_{n\to+\infty}(F_{k_n}(b)-F_{k_n}(a))\), 所以根据 \(\varphi_F\) 的连续性, \(\forall\varepsilon>0,\exists\tau>0,\mathrm{s.t.}\):
\[\frac1{2\tau}|\int_{-\tau}^\tau\varphi_F(t)\mathrm dt|
>\lim_{n\to+\infty}(F_{k_n}(b)-F_{k_n}(a))-\varepsilon
\]
综合就有:
\[\lim_{n\to+\infty}(F_{k_n}(b)-F_{k_n}(a))-\varepsilon
<F(X)-F(-X)+\frac{B-A}{X\tau}
<F(b)-F(a)+\frac{B-A}{X\tau}
\]
\[\le\liminf_{n\to+\infty}F_{k_n}(b)-\limsup_{n\to+\infty}F_{k_n}(a)+\frac{B-A}{X\tau}
=\lim_{n\to+\infty}(F_{k_n}(b)-F_{k_n}(a))+\frac{B-A}{X\tau}
\]
左右令 \(X\to+\infty\), 再令 \(\varepsilon\to0\) 即可得到 \(\lim_{n\to+\infty}(F_{k_n}(b)-F_{k_n}(a))=F(b)-F(a)\), 于是只能 \(\lim_{n\to+\infty}F_{k_n}(a)=F(a),\lim_{n\to+\infty}F_{k_n}(b)=F(b)\).
这样就满足了 Helly 第二定理的条件, 可以知道 \(\varphi=\varphi_F\). 但这只是子列 \(F_{n_k}\xrightarrow{\mathrm W}F\), 不过根据前面证过的唯一性和反证法可知 \(F_n\xrightarrow{\mathrm W}F\).
于是 \(F_n\xrightarrow{\mathrm W}F,\lim_{n\to+\infty}F_n(a)=F(a),\lim_{n\to+\infty}F_n(b)=F(b)\) 当且仅当 \(\varphi_{F_n}\rightarrow\varphi_F\), 这叫做 Lévy 连续性定理.
不等
若有凸函数 \(l\colon\mathbb R\to\mathbb R\), 则 \(\exists a,b\in\mathbb R,\mathrm{s.t.}aE[X]+b=l(E[X]),\forall u\in\mathbb R,au+b\le l(u)\):
\[E[l(X)]
\ge E[aX+b]
=aE[X]+b
=l(E[X])
\]
这叫 Jensen 不等式, 三角积分不等式是它的特例.
考虑对任意随机变量 \(X\) 和正数 \(a>0\):
\[P\{|X|\ge a\}
=\int_{|X|\ge a}\mathrm dF
\le\int_{|X|\ge a}\frac{|X|}a\mathrm dF
\le\int\frac{|X|}a\mathrm dF
=\frac{E[|X|]}a
\]
这叫 Markov 不等式. 若 \(X\) 存在方差:
\[P\{|X-E[X]|\ge a\}
=P\{|X-E[X]|^2\ge a^2\}
\le\frac{E[(X-E[X])^2]}{a^2}
=\frac{D[X]}{a^2}
\]
这叫 Chebyshev 不等式.:
若 \(\{A_n\}_{n=0}^{+\infty}\) 为事件列, 则定义 \(\liminf_{n\to+\infty}A_n=\bigcup_{n=0}^{+\infty}\bigcap_{k=n}^{+\infty}A_n,\limsup_{n\to+\infty}A_n=\bigcap_{n=0}^{+\infty}\bigcup_{k=n}^{+\infty}A_n\), 作差后根据概率论公理体系可得出不等式:
\[P(\liminf_{n\to+\infty}A_n)
\le\liminf_{n\to+\infty}P(A_n)
\le\limsup_{n\to+\infty}P(A_n)
\le P(\limsup_{n\to+\infty}A_n)
\]
而单调时概率论公理保证均能取等. 这叫 Fatou 引理.
\(\forall t\in\mathbb R,n\in\mathbb N\):
\[|\exp(\mathrm it)-\sum_{k=0}^{n-1}\frac{(\mathrm it)^k}{k!}|
\le\frac{|t|^n}{n!}
\]
这是 Cauchy 估计的一个特例, 证明就是把 Cauchy 积分公式的证明搬过来.
当 \(\{a_k\in\mathbb C\}_{k=0}^{n-1},\{b_k\in\mathbb C\}_{k=0}^{n-1}\) 满足 \(|a_k|\le1,|b_k|\le1\) 时:
\[|\prod_{k=0}^{n-1}a_k-\prod_{k=0}^{n-1}b_k|
\le\sum_{k=0}^{n-1}|a_k-b_k|
\]
归纳即可.
对于收敛到 \(a\) 的实数列 \(\{a_k\}_{k=0}^{+\infty}\) 和发散正项级数 \(\sum_{k=0}^{+\infty}b_k=+\infty\), 有:
\[\lim_{n\to+\infty}\frac{\sum_{k=0}^{n-1}a_kb_k}{\sum_{k=0}^{n-1}b_k}
=a
\]
这叫 Kronecker 引理, 证明是经典数分习题, 一个 Abel 变换即可. 当 \(b_k=1\) 时是一个更经典的数分习题, 在某些书里叫 Cauchy 极限定理.
令 \(S_n=\sum_{k=0}^{n-1}b_k\), 则条件变为正数列 \(\{S_n\}_{n=0}^{+\infty}\) 不降且发散到 \(+\infty\). 再设 \(x_k=a_kb_k\), 则有另一个形式:
\[\lim_{n\to+\infty}\frac{\sum_{k=0}^{n-1}x_k}{\sum_{k=0}^{n-1}b_k}
=\lim_{n\to+\infty}\frac{x_n}{b_n}
\]
这是我们再熟悉不过的 Stolz 定理.
逼近
当有可数个随机变量 \(\{\xi_n\}_{n=0}^{+\infty}\) 的时候, 我们更关心它们的极限. \(\forall n\in\mathbb N\), 设 \(\xi_n\) 的分布函数为 \(F_n\colon\mathbb R\to[0,1]\), \(\xi\) 的分布函数为 \(F\colon\mathbb R\to[0,1]\), 称 \(\xi_n\) 依分布收敛到 \(\xi\), 当且仅当:
\[F_n\xrightarrow{\mathrm W}F
\]
并记作 \(\xi_n\xrightarrow{\mathrm L}\xi\).
称 \(\xi_n\) 依概率收敛到 \(\xi\), 当且仅当:
\[\forall\varepsilon>0,
\lim_{n\to+\infty}P\{|\xi_n-\xi|\ge\varepsilon\}=0
\]
并记作 \(\xi_n\xrightarrow{\mathrm P}\xi\).
\(\forall r>0\), 称 \(\xi_n\) \(r\) 阶收敛到 \(\xi\), 当且仅当:
\[\lim_{n\to+\infty}E[|\xi_n-\xi|^r]
=0
\]
并记作 \(\xi_n\xrightarrow r\xi\).
称 \(\xi_n\) 几乎处处收敛到 \(\xi\), 当且仅当:
\[P(\{\omega\in\Omega\mid\lim_{n\to+\infty}\xi_n(\omega)=\xi(\omega)\})
=1
\]
并记作 \(\xi_n\xrightarrow{\mathrm{a.s.}}\xi\).
这几种收敛的强度是有严格顺序的, 大致为:
\[\xi_n\xrightarrow{\mathrm{a.s.}}\xi
\Rightarrow\xi_n\xrightarrow{\mathrm P}\xi
\Rightarrow\xi_n\xrightarrow{\mathrm L}\xi
\]
而 \(r\) 阶收敛较为特殊, \(r\) 越大越强, 且:
\[\xi_n\xrightarrow r\xi
\Rightarrow\xi_n\xrightarrow{\mathrm P}\xi
\]
当 \(\xi\) 为常数时, 可以反过来 \(\xi_n\xrightarrow{\mathrm L}\xi\Rightarrow\xi_n\xrightarrow{\mathrm P}\xi\); 当 \(\xi_n\) 单调时, 可以反过来 \(\xi_n\xrightarrow{\mathrm P}\xi\Rightarrow\xi_n\xrightarrow{\mathrm{a.s.}}\xi\).
对于 \(\xi_n\xrightarrow{\mathrm P}\xi\Rightarrow\xi_n\xrightarrow{\mathrm L}\xi\), 考虑连续点 \(x\in\mathbb R\) 和区间 \((a,b)\subset\mathbb R\) 使得 \(x\in(a,b)\):
\[F(a)
=\lim_{n\to+\infty}(P\{\xi<a,\xi_n<x\}+P\{\xi<a,\xi_n\ge x\})
\]
\[\le\liminf_{n\to+\infty}(P\{\xi_n<x\}+P\{|\xi_n-\xi|\ge x-a\})
=\liminf_{n\to+\infty}F_n(x)
\]
\[\limsup_{n\to+\infty}F_n(x)
=\limsup_{n\to+\infty}(P\{\xi<b,\xi_n<x\}+P\{\xi\ge b,\xi_n<x\})
\]
\[\le P\{\xi<b\}+\lim_{n\to+\infty}(P\{|\xi_n-\xi|\ge b-x\})
=F(b)
\]
于是 \(F(a)\le\liminf_{n\to+\infty}F_n(x)\le\limsup_{n\to+\infty}F_n(x)\le F(b)\), 令 \(a\to x-,b\to x+\) 即有 \(\lim_{n\to+\infty}F_n(x)=F(x)\).
对于 \(\xi_n\xrightarrow r\xi\Rightarrow\xi_n\xrightarrow{\mathrm P}\xi\), 使用 Markov 不等式:
\[P\{|\xi_n-\xi|\ge\varepsilon\}
=P\{|\xi_n-\xi|^r\ge\varepsilon^r\}
\le\frac{E[|\xi_n-\xi|^r]}{\varepsilon^r}
\]
再令 \(n\to+\infty\) 即可.
对于 \(\xi_n\xrightarrow r\xi\Rightarrow\xi_n\xrightarrow s\xi(r>s>0)\), 直接有:
\[E[|\xi_n-\xi|^s]
=E[(|\xi_n-\xi|^r)^{\frac sr}]
\le(E[|\xi_n-\xi|^r])^{\frac sr}
\]
再令 \(n\to+\infty\) 即可.
\(\xi\) 为常数 \(C\) 时, 对于 \(\xi_n\xrightarrow{\mathrm L}C\Rightarrow\xi_n\xrightarrow{\mathrm P}C\), 直接有:
\[P\{|\xi_n-C|\ge\varepsilon\}
=P\{\xi_n\le C-\varepsilon\}+P\{\xi_n\ge C+\varepsilon\}
=F_n((C-\varepsilon)+)+1-F_n(C+\varepsilon)
\]
再令 \(n\to+\infty\) 即可.
几乎处处收敛涉及到更底层的概率论体系, 首先需要说明概率是良定义的, 即需要按照 \(\varepsilon-\delta\) 语言展开:
\[P(\{\omega\in\Omega\mid\lim_{n\to+\infty}\xi_n(\omega)=\xi(\omega)\})
=P(\{\omega\in\Omega\mid\bigwedge_{m=1}^{+\infty}\bigvee_{k=0}^{+\infty}\bigwedge_{n=k}^{+\infty}|\xi_n(\omega)-\xi(\omega)|<\frac1m\})
\]
\[=P(\bigcap_{m=1}^{+\infty}\bigcup_{k=0}^{+\infty}\bigcap_{n=k}^{+\infty}\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\frac1m\})
\]
而 \(|\xi_n-\xi|\) 是随机变量, 所以 \(\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\frac1m\}\in\mathcal F\), 再根据可数可交和可数可并即有良定义. 另外可以展开定义:
\[P(\{\omega\in\Omega\mid\lim_{n\to+\infty}\xi_n(\omega)=\xi(\omega)\})=1
\Leftrightarrow P(\bigcap_{m=1}^{+\infty}\bigcup_{k=0}^{+\infty}\bigcap_{n=k}^{+\infty}\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\frac1m\})=1
\]
注意到这是随 \(m\) 和 \(k\) 单调的:
\[\Leftrightarrow\forall\varepsilon>0,P(\bigcup_{k=0}^{+\infty}\bigcap_{n=k}^{+\infty}\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\varepsilon\})=1
\Leftrightarrow\forall\varepsilon>0,P(\liminf_{n\to+\infty}\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\varepsilon\})=1
\]
\[\Leftrightarrow\forall\varepsilon>0,\lim_{k\to+\infty}P(\bigcap_{n=k}^{+\infty}\{\omega\Bigm||\xi_n(\omega)-\xi(\omega)|<\varepsilon\})=1
\]
根据 Fatou 引理:
\[P(\liminf_{n\to+\infty}\{|\xi_n-\xi|<\varepsilon\})
\le\liminf_{n\to+\infty}P\{|\xi_n-\xi|<\varepsilon\}
\le\limsup_{n\to+\infty}P\{|\xi_n-\xi|<\varepsilon\}
\le P(\limsup_{n\to+\infty}\{|\xi_n-\xi|<\varepsilon\})
\]
所以可以看出 \(\xi_n\xrightarrow{\mathrm{a.s.}}\xi\Rightarrow\xi_n\xrightarrow{\mathrm P}\xi\). 单调时上面这个不等式链均取等, 此时可以反过来有 \(\xi_n\xrightarrow{\mathrm P}\xi\Rightarrow\xi_n\xrightarrow{\mathrm{a.s.}}\xi\).
再来一个 Borel-Cantelli 引理:
当 \(\sum_{n=0}^{+\infty}P(A_n)<+\infty\) 时, 有:
\[P(\limsup_{n\to+\infty}A_n)
=\lim_{k\to+\infty}P(\bigcup_{n=k}^{+\infty}A_n)
\le\lim_{k\to+\infty}\sum_{n=k}^{+\infty}P(A_n)
=\sum_{n=0}^{+\infty}P(A_n)-\lim_{k\to+\infty}\sum_{n=0}^{k-1}P(A_n)
=0
\]
当 \(\sum_{n=0}^{+\infty}P(A_n)=+\infty\) 且 \(\{A_n\}_{n=0}^{+\infty}\) 相互独立时, 有:
\[P(\limsup_{n\to+\infty}A_n)
=\lim_{k\to+\infty}P(\bigcup_{n=k}^{+\infty}A_n)
=\lim_{k\to+\infty}(1-\prod_{n=k}^{+\infty}(1-P(A_n)))
\ge1-\lim_{k\to+\infty}\exp(-\sum_{n=k}^{+\infty}P(A_n))
\]
\[=1-\lim_{k\to+\infty}\exp(\sum_{n=0}^{k-1}P(A_n)-\sum_{n=0}^{+\infty}P(A_n))
=1
\]
所以 \(P(\limsup_{n\to+\infty}A_n)=1\). 由上一条可知, 反过来也是成立的.
应用一下第一条:
\[\xi_n\xrightarrow{\mathrm{a.s.}}\xi
\Leftrightarrow\forall\varepsilon>0,P(\liminf_{n\to+\infty}\{|\xi_n-\xi|<\varepsilon\})=1
\Leftrightarrow\forall\varepsilon>0,P(\limsup_{n\to+\infty}\{|\xi_n-\xi|\ge\varepsilon\})=0
\]
\[\Leftarrow\forall\varepsilon>0,\sum_{n=0}^{+\infty}P\{|\xi_n-\xi|\ge\varepsilon\}<+\infty
\]
这就得到了一个几乎处处收敛的简单判定方法.
大数
对于随机变量列 \(\{\xi_n\}_{n=0}^{+\infty}\), 若存在常数列 \(\{a_n\}_{n=0}^{+\infty}\) 满足:
\[\frac1n\sum_{k=0}^{n-1}\xi_k
\xrightarrow{\mathrm P}a_n
\]
则称 \(\{\xi_n\}_{n=0}^{+\infty}\) 服从大数律. 若:
\[\frac1n\sum_{k=0}^{n-1}\xi_k
\xrightarrow{\mathrm{a.s.}}a_n
\]
则称 \(\{\xi_n\}_{n=0}^{+\infty}\) 服从强大数律.
若各随机变量均存在期望且独立, 则根据特征函数应当有 \(a_n=\frac1n\sum_{k=0}^{n-1}E[\xi_k]\), 故自然令 \(S_n=\sum_{k=0}^{n-1}(\xi_k-E[\xi_k])\).
若存在方差, 则有:
\[D[\frac1n\sum_{k=0}^{n-1}\xi_k]
=\frac1{n^2}(E[\sum_{k=0}^{n-1}\xi_k]^2-E[(\sum_{k=0}^{n-1}\xi_k)^2])
\]
\[=\frac1{n^2}(\sum_{k=0}^{n-1}(E[\xi_k]^2-E[\xi_k^2])+\sum_{k=0}^{n-1}\sum_{l=k+1}^{n-1}(E[\xi_k]E[\xi_l]-E[\xi_k\xi_l]))
=\frac1{n^2}\sum_{k=0}^{n-1}D[\xi_k]
\]
于是根据 Chebyshev 不等式直接有:
\[P\{|S_n|\ge\varepsilon\}
=P\{|S_n|^2\ge\varepsilon^2\}
\le\frac{E[|S_n|^2]}{\varepsilon^2}
=\frac{D[\frac1n\sum_{k=0}^{n-1}\xi_k]}{\varepsilon^2}
=\frac{D[\sum_{k=0}^{n-1}\xi_k]}{n^2\varepsilon^2}
\]
所以 \(\frac1{n^2}D[\sum_{k=0}^{n-1}\xi_k]\to0\) 时有 \(P\{S_n\ge\varepsilon\}\to0\), 即满足大数律, 这叫做 Markov 大数律, 这个条件称做 Markov 条件.
若方差有一致上界 \(C\), 则 Markov 条件自动满足, 叫做 Chebyshev 大数律. 为概率相同的两点分布, 则 Markov 条件自动满足, 叫做 Bernoulli 大数律. 另外均为两点分布但概率不同也可以, 叫做 Poisson 大数律.
再看强大数律. 下面全部需要独立. 这里二阶原点矩不够用了, 需要四阶原点矩存在:
\[P\{|\frac{S_n}n|\ge\varepsilon\}
=P\{S_n^4\ge n^4\varepsilon^4\}
\le\frac{E[S_n^4]}{n^4\varepsilon^4}
\]
这个需要展开后, 讨论各个项, 最后剩下非零项:
\[=\frac{n\sum_{k=0}^{n-1}E[(\xi_k-E(\xi_k))^4]+3\sum_{k\neq l}E[(\xi_k-E(\xi_k))^2]E[(\xi_l-E(\xi_l))^2]}{n^4\varepsilon^4}
\]
记 \(E[(\xi_k-E(\xi_k))^4]=Q[\xi_k]\):
\[\le\frac1{\varepsilon^2}(\frac{\sum_{k=0}^{n-1}Q[\xi_k]}{n^4}+3\frac{\sum_{k\neq l}^{n-1}D[\xi_k]D[\xi_l]}{n^4})
\]
于是在 \(Q[\xi_k]\) 和 \(D[\xi_k]\) 有一致界时, 级数 \(\sum_{n=0}^{+\infty}P\{|\frac{S_n}n|\ge\varepsilon\}\) 收敛, 满足强大数律. 在 \(\xi_k\) 为两点分布时, 这个条件自动满足, 叫 Borel 强大数定律.
为了更广泛的情况, 首先要证明一堆引理. 取非增常数序列 \(\{C_k\}_{k=0}^{+\infty}\), 则 \(\forall m,n\in\mathbb N,\varepsilon>0\), 若 \(m<n\), 令 \(Y=\sum_{k=m}^{n-1}S_k^2(C_k^2-C_{k+1}^2)+C_n^2S_n^2,E_k\) 为事件 \(|C_kS_k|\ge\varepsilon\wedge\forall l\in[m,k)\cap\mathbb N,|C_lS_l|<\varepsilon\). 枚举最后一个超过 \(\varepsilon\) 的值:
\[P\{\sup_{k=m}^{n-1}|C_kS_k|\ge\varepsilon\}
=\sum_{k=m}^{n-1}P(E_k)
=\sum_{k=m}^{n-1}\frac{P(E_k)}{C_k^2}(\sum_{l=k}^{n-1}(C_l^2-C_{l+1}^2)+C_n^2)
\]
在 \(E_k\) 的条件下, 因为独立性, 所以 \(E[S_l^2]=D[S_l]=\sum_{p=0}^{l-1}D[\xi_p]\), 继而 \(\frac1{C_k^2}\le\frac1{\varepsilon^2}E[S_k^2]\le\frac1{\varepsilon^2}E[S_l^2]\):
\[\le\sum_{k=m}^{n-1}P(E_k)(\sum_{l=k}^{n-1}\frac1{\varepsilon^2}E[S_l^2\mid E_k](C_l^2-C_{l+1}^2)+\frac1{\varepsilon^2}E[S_n^2\mid E_k]C_n^2)
\]
因为 \(\{C_k\}_{k=m}^n\) 不增, 所以级数项都是非负的:
\[\le\frac1{\varepsilon^2}\sum_{k=m}^{n-1}P(E_k)(\sum_{l=m}^{n-1}E[S_l^2\mid E_k](C_l^2-C_{l+1}^2)+E[S_n^2\mid E_k]C_n^2)
=\frac1{\varepsilon^2}\sum_{k=m}^{n-1}P(E_k)E[Y\mid E_k]
\]
注意这只有 \(\sup_{k=m}^{n-1}|C_kS_k|\ge\varepsilon\) 的概率, 记事件 \(E_r\) 为 \(\sup_{k=m}^{n-1}|C_kS_k|<\varepsilon\), 因为 \(Y\) 非负:
\[\le\frac1{\varepsilon^2}(\sum_{k=m}^{n-1}P(E_k)E[Y\mid E_k]+P(E_r)E[Y\mid E_r])
=\frac1{\varepsilon^2}E[Y]
\]
最后是一堆求和变换:
\[=\frac1{\varepsilon^2}E[\sum_{k=m}^{n-1}S_k^2(C_k^2-C_{k+1}^2)+C_n^2S_n^2]
=\frac1{\varepsilon^2}(\sum_{k=m}^{n-1}\sum_{l=0}^{k-1}(C_k^2-C_{k+1}^2)D[\xi_l]+C_n^2\sum_{k=0}^{n-1}D[\xi_k])
\]
\[=\frac1{\varepsilon^2}(\sum_{l=0}^{m-1}\sum_{k=m}^{n-1}(C_k^2-C_{k+1}^2)D[\xi_l]+\sum_{l=m}^{n-1}\sum_{k=l+1}^{n-1}(C_k^2-C_{k+1}^2)D[\xi_l]+C_n^2\sum_{k=0}^{n-1}D[\xi_k])
\]
\[=\frac1{\varepsilon^2}(\sum_{l=0}^{m-1}(C_m^2-C_n^2)D[\xi_l]+\sum_{l=m}^{n-1}(C_{l+1}^2-C_n^2)D[\xi_l]+C_n^2\sum_{k=0}^{n-1}D[\xi_k])
\]
\[=\frac1{\varepsilon^2}(C_m^2\sum_{k=0}^{m-1}D[\xi_k]+\sum_{k=m}^{n-1}C_{k+1}^2D[\xi_k])
\]
这叫 Hajek-Renyi 不等式. 特例为:
\[P\{\sup_{k=0}^{n-1}|S_k|\ge\varepsilon\}
=\frac1{\varepsilon^2}\sum_{k=0}^{n-1}D[\xi_k]
\]
这叫 Kolmogorov 不等式, 再取 \(n=1\) 就是 Chebyshev 不等式.
于是考虑 \(\forall\varepsilon>0\):
\[\lim_{k\to+\infty}P(\bigcup_{n=k}^{+\infty}\{\omega\Bigm|\frac1n|S_n|\ge\varepsilon\})
\le\lim_{k\to+\infty}P\{\sup_{n=k}^{+\infty}\frac1n|S_n|\ge \varepsilon\}
\]
令 \(C_n=\frac1{\max(1,n)}\), 利用刚刚的不等式放缩:
\[\le\lim_{k\to+\infty}\lim_{n\to+\infty}\frac1{\varepsilon^2}(\frac{\sum_{l=0}^{k-1}D[\xi_l]}{k^2}+\sum_{l=k}^{n-1}\frac{D[\xi_l]}{l^2})
=\frac1{\varepsilon^2}\lim_{k\to+\infty}(\frac{\sum_{l=0}^{k-1}D[\xi_l]}{k^2}+\sum_{l=k}^{+\infty}\frac{D[\xi_l]}{l^2})
\]
\(\sum_{n=1}^{+\infty}\frac{D[\xi_n]}{n^2}\) 收敛时, 右侧第二项等于 \(0\). 同时 \(\lim_{n\to+\infty}\frac{D[\xi_n]}{n^2}=0\) 利用 Kronecker 引理, 有:
\[=\frac1{\varepsilon^2}\lim_{k\to+\infty}\frac{\sum_{l=0}^{k-1}l^2\frac{D[\xi_l]}{l^2}}{k^2}
=\frac1{\varepsilon^2}\lim_{k\to+\infty}\frac{D[\xi_k]}{k^2}
=0
\]
所以 \(\sum_{n=1}^{+\infty}\frac{D[\xi_n]}{n^2}\) 收敛时服从强大数律. 这叫做 Kolmogorov 强大数定律, 这个条件叫做 Kolmogorov 条件.
对比 Markov 条件 \(\frac1{n^2}D[\sum_{k=0}^{n-1}\xi_k]\to0\), 会发现由 Kronecker 引理, 独立时 Kolmogorov 条件严格强于 Markov 条件.
若为独立同分布, 则设分布函数为 \(F\). 若存在期望 \(E\), 那么可以计算出 \(\frac1n\sum_{k=0}^{n-1}\xi_k\) 的特征函数, 且会发现它恰好趋于 \(t\mapsto\exp(\mathrm itE)\), 于是根据 Lévy 连续性定理 \(\frac1n\sum_{k=0}^{n-1}\xi_k\xrightarrow{\mathrm L}E\), 再因为 \(E\) 为常数, 所以可以知道它服从大数律, 这叫做 Khinchin 大数律.
事实上也服从强大数律. 取随机变量 \(\eta_n=\begin{cases}\xi_n&|\xi_n|<n\\0&|\xi_n|\ge n\\
\end{cases}\), 于是:
\[|S_n|
=|\frac1n\sum_{k=0}^{n-1}(\xi_k-E)|
\le|\frac1n\sum_{k=0}^{n-1}(\xi_k-\eta_k)|+|\frac1n\sum_{k=0}^{n-1}(\eta_k-E[\eta_k])|+|\frac1n\sum_{k=0}^{n-1}(E[\eta_k]-E)|
\]
第一项需要看定义, 考虑:
\[\sum_{n=0}^{+\infty}P\{|\xi_n|\ge n\}
=\sum_{n=0}^{+\infty}\sum_{k=n}^{+\infty}P\{k\le|\xi_n|<k+1\}
\]
\[=\sum_{k=0}^{+\infty}\sum_{n=0}^kP\{k\le|\xi_n|<k+1\}
=\sum_{k=0}^{+\infty}P\{k\le|\xi_k|<k+1\}(k+1)
\le E
\]
所以根据 Borel-Cantelli 引理, \(P(\limsup_{n\to+\infty}\{\omega\Bigm||\xi_n|\ge n\})=0\):
\[P(\{\omega\mid\lim_{n\to+\infty}\frac1n\sum_{k=0}^{n-1}(\xi_k(\omega)-\eta_k(\omega))=0\})
\le P(\limsup_{n\to+\infty}\{\omega\mid\omega(\xi_n)\neq\omega(\eta_n)\})
\le P(\limsup_{n\to+\infty}\{\omega\Bigm||\xi_n|\ge n\})
=0
\]
从而第一项几乎处处收敛到 \(0\).
第二项可验证 Kolmogorov 条件:
\[\sum_{n=1}^{+\infty}\frac{D[\eta_n]}{n^2}
\le\sum_{n=1}^{+\infty}\frac{E[\eta_n^2]}{n^2}
=\sum_{n=1}^{+\infty}\frac1{n^2}\int_{-n}^nx^2\mathrm dF(x)
\le\sum_{n=1}^{+\infty}\frac1{n^2}\sum_{k=0}^{n-1}(k+1)^2P\{k\le|\xi_n|<k+1\}
\]
\[=\sum_{k=0}^{+\infty}(k+1)^2P\{k\le|\xi_n|<k+1\}\sum_{n=k+1}^{+\infty}\frac1{n^2}
\le\sum_{k=0}^{+\infty}(k+1)^2P\{k\le|\xi_n|<k+1\}\sum_{n=k+1}^{+\infty}\frac1{(n-1)n}
\]
\[=\sum_{k=0}^{+\infty}\frac{(k+1)^2}kP\{k\le|\xi_n|<k+1\}
\le3+\sum_{k=0}^{+\infty}kP\{k\le|\xi_n|<k+1\}
\le3+E
\]
从而第二项几乎处处收敛到 \(0\).
第三项就是一个常量:
\[\lim_{n\to+\infty}\frac1n\sum_{k=0}^{n-1}(E[\eta_k]-E)
=\lim_{n\to+\infty}\frac1n\sum_{k=0}^{n-1}(\int_{-k}^kx\mathrm dF(x)-\int_{-\infty}^{+\infty}x\mathrm dF(x))
\]
根据 Cauchy 极限定理可知:
\[=\lim_{n\to+\infty}(\int_{-n}^nx\mathrm dF(x)-\int_{-\infty}^{+\infty}x\mathrm dF(x))
=0
\]
综合就有 \(\{\xi_n\}_{n=0}^{+\infty}\) 满足强大数律.
中心
对于独立的随机变量列 \(\{\xi_n\}_{n=0}^{+\infty}\), 令:
\[S_n
=\sum_{k=0}^{n-1}\xi_k,
Z_n
=\frac{S_n-E[S_n]}{\sqrt{D[S_n]}}
=\sum_{k=0}^{n-1}\frac{\xi_k-E[\xi_k]}{\sqrt{\sum_{k=0}^{n-1}D[\xi_k]}}
\]
则并记 \(\eta_{n,k}=\frac{\xi_k-E[\xi_k]}{\sqrt{\sum_{k=0}^{n-1}D[\xi_k]}}\), 则有:
\[Z_n
=\sum_{k=0}^{n-1}\eta_{n,k},
E[Z_n]
=\frac{E[S_n]-E[S_n]}{\sqrt{D[S_n]}}
=0,
D[Z_n]
=\frac{D[S_n]}{(\sqrt{D[S_n]})^2}
=1
\]
在 \(\xi_n\) 同分布时可以通过特征函数算出 \(Z_n\xrightarrow{\mathrm L}N(0,1)\). 这叫做 Lindeberg-Lévy 中心极限定理. 而 \(\xi_n\) 为同概率的两点分布时叫做 De Moivre-Laplace 中心极限定理.
不同分布就有点复杂了. 称:
\[\forall\tau>0,
\lim_{n\to+\infty}\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
=0
\]
为 Lindeberg 条件.
另一个条件叫做 Feller 条件:
\[\lim_{n\to+\infty}\max_{k=0}^{n-1}D[\eta_{n,k}]
=0
\Leftrightarrow\lim_{n\to+\infty}\max_{k=0}^{n-1}\sqrt{\frac{D[\xi_k]}{D[S_n]}}
=0
\Leftrightarrow\lim_{n\to+\infty}\frac{\max_{k=0}^{n-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]}
=0
\]
\[\Leftrightarrow\sum_{k=0}^{+\infty}D[\xi_k]=+\infty,\lim_{n\to+\infty}\frac{D[\xi_n]}{\sum_{k=0}^{n-1}D[\xi_k]}=0
\]
最后一个等价条件的分子写成 \(D[\xi_{n-1}]\) 也对, 需要证明它和前面的等价.
左到右, 首先 \(\sum_{k=0}^{+\infty}D[\xi_k]\) 收敛很容易推出矛盾, 其次:
\[\frac{D[\xi_n]}{\sum_{k=0}^{n-1}D[\xi_k]}
=\frac{\frac{D[\xi_n]}{\sum_{k=0}^nD[\xi_k]}}{1-\frac{D[\xi_n]}{\sum_{k=0}^nD[\xi_k]}}
\]
而 \(0\le\frac{D[\xi_n]}{\sum_{k=0}^nD[\xi_k]}\le\frac{\max_{k=0}^nD[\xi_k]}{\sum_{k=0}^nD[\xi_k]}\).
右到左, 展开极限的定义 \(\forall\varepsilon>0,\exists N\in\mathbb N,\mathrm{s.t.}\forall n\in[N,+\infty)\cap\mathbb N\), \(\frac{D[\xi_n]}{\sum_{k=0}^{n-1}D[\xi_k]}<\varepsilon\):
\[\frac{\max_{k=0}^{n-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]}
=\max(\frac{\max_{k=0}^{N-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]},\frac{\max_{k=N}^{n-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]})
\le\max(\frac{\max_{k=0}^{N-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]},\max_{k=N}^{n-1}\frac{D[\xi_k]}{\sum_{l=0}^{k-1}D[\xi_l]})
\]
\(\frac{\max_{k=0}^{N-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]}\) 分子为常数, 分母发散; \(\max_{k=N}^{n-1}\frac{D[\xi_k]}{\sum_{l=0}^{k-1}D[\xi_l]}\) 中的每一项均不超过 \(\varepsilon\). 于是令 \(n\to+\infty\) 可得 \(\lim_{n\to+\infty}\frac{\max_{k=0}^{n-1}D[\xi_k]}{\sum_{k=0}^{n-1}D[\xi_k]}\le\varepsilon\), 再令 \(\varepsilon\to0\) 即可.
Lindeberg 条件可以推出 Feller 条件, 这是因为 \(\forall\tau>0\):
\[\max_{k=0}^{n-1}D[\eta_{n,k}]
=\max_{k=0}^{n-1}E[\eta_{n,k}^2]
=\max_{k=0}^{n-1}(E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}+E[\eta_{n,k}^2\Bigm||\eta_{n,k}|\le\tau]P\{|\eta_{n,k}|\le\tau\})
\]
\[\le\tau^2+\max_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|\le\tau]P\{|\eta_{n,k}|\le\tau\}
\le\tau^2+\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
令 \(n\to+\infty\) 即可知 \(\lim_{n\to+\infty}\max_{k=0}^{n-1}D[\eta_{n,k}]\le\tau^2\), 再令 \(\tau\to0\) 即可.
要从两个条件推出中心极限定理. 因为中心极限定理只要求按分布收敛, 所以放心大胆用特征函数法:
\[|\varphi_{\eta_{n,k}}(t)-1|
=|E[\exp(\mathrm it\eta_{n,k})]-1-\mathrm itE[\eta_{n,k}]|
=|E[\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}]|
\]
通过 \(|\exp(z)-1-z|\le\frac12|z|^2\) 放缩:
\[\le E[|\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}|]
\le E[\frac12t^2\eta_{n,k}^2]
=\frac{t^2}2D[\eta_{n,k}]
=\frac{t^2D[\xi_k]}{2\sum_{l=0}^{n-1}D[\xi_l]}
\le\frac{t^2\max_{l=0}^{n-1}D[\xi_l]}{2\sum_{l=0}^{n-1}D[\xi_l]}
\]
所以 Feller 条件成立时, 在 \(n\to+\infty\) 时, 右侧趋于 \(0\). 估算 \(\varphi_{Z_n}(t)\):
\[|\exp(\sum_{k=0}^{n-1}(\varphi_{\eta_{n,k}}(t)-1))-\varphi_{Z_n}(t)|
=|\prod_{k=0}^{n-1}\exp(\varphi_{\eta_{n,k}}(t)-1)-\prod_{k=0}^{n-1}\varphi_{\eta_{n,k}}(t)|
\]
\[\le\sum_{k=0}^{n-1}|\exp(\varphi_{\eta_{n,k}}(t)-1)-\varphi_{\eta_{n,k}}(t)|
=\sum_{k=0}^{n-1}|\exp(\varphi_{\eta_{n,k}}(t)-1)-1-(\varphi_{\eta_{n,k}}(t)-1)|
\]
\(\forall\delta>0\), 因为 \(|z|\le2\delta\) 时 \(|\exp(z)-1-z|\le\frac12|z|^2\le\delta|z|\), 而 \(n\) 足够大时确实有 \(|\varphi_{\eta_{n,k}}(t)-1|\le2\delta\):
\[\le\sum_{k=0}^{n-1}\delta|\varphi_{\eta_{n,k}}(t)-1|
\le\sum_{k=0}^{n-1}\frac{\delta t^2D[\xi_k]}{2\sum_{l=0}^{n-1}D[\xi_l]}
=\frac12\delta t^2
\]
令 \(\delta\to0\) 即可知, Feller 条件下 \(\lim_{n\to+\infty}|\exp(\sum_{k=0}^{n-1}(\varphi_{\eta_{n,k}}(t)-1))-\varphi_{Z_n}(t)|=0\).
中心极限定理等价于 \(\lim_{n\to+\infty}\varphi_{Z_n}(t)=\exp(-\frac12t^2)\), 由此可知 Feller 条件下这等价于 \(\lim_{n\to+\infty}\sum_{k=0}^{n-1}(\varphi_{\eta_{n,k}}(t)-1)=-\frac12t^2\). 接下来只需要估算:
\[|\sum_{k=0}^{n-1}(\varphi_{\eta_{n,k}}(t)-1)+\frac12t^2|
=|\sum_{k=0}^{n-1}(E[\exp(\mathrm it\eta_{n,k})]-1-\mathrm itE[\eta_{n,k}])+\frac12t^2E[Z_n^2]|
\]
\[=|\sum_{k=0}^{n-1}E[\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2]|
\le\sum_{k=0}^{n-1}E[|\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2|]
\]
尝试利用 Lindeberg 条件, \(\forall\tau>0\), 分成两部分分别放缩. 对于 \(|\eta_{n,k}|\le\tau\) 的部分:
\[\sum_{k=0}^{n-1}E[|\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2|\Bigm||\eta_{n,k}|\le\tau]P\{|\eta_{n,k}|\le\tau\}
\]
\[\le\sum_{k=0}^{n-1}E[\frac16t^3|\eta_{n,k}|^3\Bigm||\eta_{n,k}|\le\tau]P\{|\eta_{n,k}|\le\tau\}
\le\frac16t^3\tau\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|\le\tau]P\{|\eta_{n,k}|\le\tau\}
\]
\[\le\frac16t^3\tau\sum_{k=0}^{n-1}E[\eta_{n,k}^2]
=\frac16t^3\tau\sum_{k=0}^{n-1}D[\eta_{n,k}]
=\frac16t^3\tau D[Z_n]
=\frac16t^3\tau
\]
对于 \(|\eta_{n,k}|>\tau\) 的部分:
\[\sum_{k=0}^{n-1}E[|\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2|\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
\[\le\sum_{k=0}^{n-1}E[\frac12t^2\eta_{n,k}^2+\frac12t^2\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
=t^2\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
两个式子加起来, 就有:
\[|\sum_{k=0}^{n-1}(\varphi_{\eta_{n,k}}(t)-1)+\frac12t^2|
\le\frac16t^3\tau+t^2\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
Lindeberg 条件下, 令 \(\tau\to0\) 再令 \(n\to+\infty\) 可知左侧趋于 \(0\), 于是中心极限定理成立.
其实也能反过来. \(\forall\tau>0\):
\[|\sum_{k=0}^{n-1}E[\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2]|
\]
\[\ge\sum_{k=0}^{n-1}|\operatorname{Re}(E[\exp(\mathrm it\eta_{n,k})-1-\mathrm it\eta_{n,k}+\frac12t^2\eta_{n,k}^2])|
\ge\sum_{k=0}^{n-1}E[|\cos(t\eta_{n,k})-1+\frac12t^2\eta_{n,k}^2|]
\]
\[\ge\sum_{k=0}^{n-1}E[\frac12t^2\eta_{n,k}^2-2]
\ge\sum_{k=0}^{n-1}E[\frac12t^2\eta_{n,k}^2-2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
\[\ge\sum_{k=0}^{n-1}E[\frac12t^2\eta_{n,k}^2-2\frac{\eta_{n,k}^2}{\tau^2}\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
=(\frac{t^2}2-\frac2{\tau^2})\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
只要选 \(\tau\) 使得 \(\frac{t^2}2-\frac2{\tau^2}>0\), 则中心极限定理成立时左右均趋于 \(0\), 即 Lindeberg 条件成立.
总结一下, Feller 条件成立的前提下, Lindeberg 条件等价于中心极限定理, 且 Lindeberg 条件成立时 Feller 条件成立. 这叫做 Lindeberg-Feller 中心极限定理.
最后还有一个 Lyapunov 条件:
\[\exists\delta>0,\mathrm{s.t.}\lim_{n\to+\infty}\sum_{k=0}^{n-1}E[|\eta_{n,k}|^{2+\delta}]
=0
\]
考虑 \(\forall\tau>0\):
\[\lim_{n\to+\infty}\sum_{k=0}^{n-1}E[\eta_{n,k}^2\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
\]
\[\le\lim_{n\to+\infty}\sum_{k=0}^{n-1}E[\frac{|\eta_{n,k}|^{2+\delta}}{\tau^\delta}\Bigm||\eta_{n,k}|>\tau]P\{|\eta_{n,k}|>\tau\}
=\frac1{\tau^\delta}\lim_{n\to+\infty}\sum_{k=0}^{n-1}E[|\eta_{n,k}|^{2+\delta}]
\]
所以 Lyapunov 条件强于 Lindeberg 条件, 而 Lyapunov 条件用起来更方便.