概率论
连续型随机变量分布
分布名称 | 概率密度函数(PDF) | 分布函数(CDF) | 期望 E[X] | 方差 D[X] | 参数说明 |
---|
均匀分布 U(a,b) | f(x)=b−a1, a≤x≤b | F(x)=b−ax−a, a≤x≤b | 2a+b | 12(b−a)2 | a<b |
指数分布 Exp(λ) | f(x)=λe−λx, x≥0 | F(x)=1−e−λx, x≥0 | λ1 | λ21 | λ>0 |
正态分布 N(μ,σ2) | f(x)=2πσ21e−2σ2(x−μ)2 | 无 | μ | σ2 | μ∈R, σ>0 |
离散型随机变量分布
分布名称 | 概率质量函数(PMF) | 分布函数(CDF) | 期望 E[X] | 方差 D[X] | 参数说明 |
---|
伯努利分布 | P(X=1)=p, P(X=0)=1−p | F(x)=⎩⎨⎧01−p1x<00≤x<1x≥1 | p | p(1−p) | 0<p<1 |
二项分布 B(n,p) | P(X=k)=(kn)pk(1−p)n−k | 累加 PMF | np | np(1−p) | n∈N, 0<p<1 |
几何分布 | P(X=k)=(1−p)k−1p, k=1,2,... | F(k)=1−(1−p)k | p1 | p21−p | 0<p<1 |
泊松分布 π(λ) | P(X=k)=k!λke−λ, k=0,1,2,… | 累加 PMF | λ | λ | λ>0 |
二项分布的众数为 ⌊(n+1)p⌋
二项分布的极限情况就是泊松分布,此时,
- n→+∞
- p→0
- np→λ
标准正态分布
XσX−μ∼N(μ,σ2)∼N(0,1)
- μ=0
- σ=1
f(x)=2π1e−2x2
EX2=1
若 X,Y∼N(μi,σi) 且相互独立,则有:
- E(XY)=Cov(X,Y)+μXμY=μXμY
- D(XY)=μX2σY2+μY2σX2+σX2σY2
- XY 一般不再是正态分布
Gauss 积分
∫−∞+∞e−x2dx=π
随机变量函数的分布
ifx=g(y)andf(x) 为 X 的 PMF, g(y) 单调, thenfY(y)=fX(g(y))g′(y)
另外注意上下限
二维正态分布
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
f(x,y)=2πσ1σ21−ρ21e−21−ρ21(σ12(x−μ1)2+σ22(x−μ2)2−σ1σ22ρ(x−μ1)(y−μ2))
正态分布满足可加性:
Xi∼N(μi,σi2)
∑ciXi∼N(∑ciμi,∑ci2σi2)
二维随机变量函数的分布
注意这里涉及到的都是 CDF
Z=X+Y 型
FZ(z)=P(Z≤z)=P(X+Y≤z)=x+y≤z∬f(x,y)dxdy=∫−∞+∞[∫−∞z−xf(x,y)dy]dx=∫−∞+∞f(x,z−x)dx=∫−∞+∞f(z−y,y)dy
Z=max(X,Y) 和 Z=min(X,Y) 型
独立同分布,则有
Fmax(z)=P(Z≤z)=P(Z≤x)P(z≤y)=FX(z)FY(z)=F2(z)
Fmin(z)=1−P(Z≥z)=1−P(Z≥x)P(z≥y)=1−[1−FX(z)][1−FY(z)]=1−[1−F(z)]2
随机变量的数字特征
EX
- 离散型随机变量 EX=∑xipi
- 连续型随机变量 EX=∫xf(x)dx
线性性质:
E(c)=cc 为常数
E(aX+bY)=aEX+bEY
E(XY)=EXEYX,Y 相互独立
E(g(X))=∑g(x)×P{x=Xi}=∫g(x)f(x)dx
DX
DX=E(X2)−(EX)2
- D(aX+b)=a2DX
- D(X±Y)=DX+DY±2Cov(X,Y)
标准差 σX=DX
特别注意标准差和方差要不要开方
一般计算样本的方差使用的是无偏方差,注意分母不是 n!
S2≡n−11i=1∑n(Xi−Xˉ)2
Cov(X,Y)
Cov(X,Y)=E(XY)−EXEY
- Cov(X,X)=DX
线性性质:
- Cov(X,c)=0
- Cov(aX,Y)=aCov(X,Y)
- Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)
ρXY
ρXY=DXDYCov(X,Y)∈[−1,1]
取值范围由 Cauchy-Schwarz 不等式得到,因为方差永远大于 0
[E(UV)]2≤E(U2)E(V2)
特殊地,
ρXY=±1⇒∃a,b, s.t. Y=aX+b
且
σXσY=∣a∣andD(X∣Y)=D(Y∣X)=0
Chebyshev 不等式
P(∣X−μ∣≥ϵ)<ϵ2σ2
大数定律
记 Xnˉ 为样本均值, ∀ϵ>0,有
n→+∞limP{∣Xnˉ−μ∣<ϵ}=1
也就是说 n→+∞ 时,样本均值依概率收敛于数学期望
中心极限定理
记 Xnˉ 为样本均值, Zn 为其标准化形式
Zn=D[Xˉn]Xˉn−E[Xˉn]=σ/nXˉn−μ∼N(0,1)
也就是说,不管 Xi 服从什么分布,其样本均值的标准化形式 Zn 都服从标准正态分布,非标准化形式满足
Xnˉ∼N(μ,nσ2)
数理统计
正态总体
Xn 是从正态总体 N(μ,σ2) 中抽取的一群样本,则样本均值和样本方差满足以下说法: (Fisher’s Lemma)
Xnˉ∼N(μ,nσ2)
- EXnˉ=μ
- DXnˉ=nμ2
σ2(n−1)S2∼χ2(n−1)
- 注意, S2 计算是使用的 Xˉ
- 如果使用均值 μ 计算方差,则不会损失自由度,它会遵从 χ2(n) 分布
- ES2=σ2
- DS2=n−12σ4
S2 和 Xˉ 是相互独立的
χ2 分布
X1,X2,…,Xk 满足 Xk∼N(0,1),则
Z=∑Xi∼χ2(k)
- EZ=k
- DZ=2k
若 Zi 独立同分布,则满足可加性:
∑Zi∼χ2(∑ki)
t 分布
- Z∼N(0,1)
- U∼χ2(k)
- 相互独立
则
T=U/kZ∼t(k)
- ET=0if k>1
- DT=k−2kif k>2
k→+∞ 时, t 分布收敛于 N(0,1)
对于从正态总体中抽取的样本 Xi,有,
σ/nXˉn−μ∼N(0,1)σ2(n−1)S2∼χ2(n−1)
则,
T=S/nXnˉ−μ=S2/σ2σ/nXˉn−μ=n−1χ2(n−1)σ/nXˉn−μ∼t(n−1)
F 分布
- U∼χ2(d1)
- V∼χ2(d2)
- 相互独立
则
F=V/d2U/d1∼F(d1,d2)
且
if T∼t(k), thenT2∼F(1,k)
点估计法
矩估计法
核心思想:令
EXt(θ)=Xntˉ
求解出矩估计量 θ^=f(xˉ)
最大似然估计法
核心思想:令
L(θ)=∏p(xi;θ)=⎩⎨⎧∏P{X=xi;θ}∏f(xi;θ)离散型随机变量连续型随机变量
取对数后求其驻点
dθdlnL(θ)=∑p(xi;θ)p′(xi;θ)=0
如果有多个最大似然估计量,例如正态分布的 μ 和 σ2,则需要求它们的偏导,组成一个方程组
⎩⎨⎧∂θ1∂lnL(θi)∂θ2∂lnL(θi)…∂θn∂lnL(θi)=0=0=0
更严谨的话还要检查一下 Hessian 矩阵
当似然函数满足:
时,参数的最大似然估计值可以是 max{Xi} 或 min{Xi}
例如均匀分布,观察值 Xi 必须处在某和 θ 相关的区间内时会涉及到这种情况
估计量评选标准
无偏性
若
Eθ^=θ
则称 θ^ 为 θ 的无偏估计量
一些无偏估计量
- EXnˉ=μ
- ES2=σ2,若样本方差计算使用的不是无偏方差,则它不是无偏的估计量
有效性
若 θi^ 和 θj^ 都是 θ 的无偏估计量
Dθi^≤Dθj^
则称 θi^ 比 θj^ 更有效
一致性
当 n→+∞ 时,估计量 θn^ 依概率收敛于 θ,即
∀ϵ>0,n→+∞limP{∣θn^−θ∣<ϵ}=1
则称 θn^ 为 θ 的一致估计量
区间估计法
注意分位点是一个坐标,而不是长度
求 μ
- 若方差已知,则 1−α 下,枢轴量 σ/nXˉ−μ∼N(0,1) 需要在 (−u2α,u2α) 区间内,求解出 μ 的置信区间为
μ∈(Xˉ±u2αnσ)
- 若方差未知,则 1−α 下,枢轴量 S/nXˉ−μ∼t(n−1) 需要在 (−t2α(n−1),t2α(n−1)) 区间内,求解出 μ 的置信区间为
μ∈(Xˉ±t2α(n−1)nS)
求 σ2
- 若期望未知,则 1−α 下,枢轴量 σ2(n−1)S2∼χ2(n−1) 需要在 (χ1−2α2(n−1),χ2α2(n−1)) 区间内,求解出 σ 的置信区间为
σ2∈(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
σ2∈(χ2α2(n−1)∑(Xi−μ)2,χ1−2α2(n−1)∑(Xi−μ)2)
求单侧置信区间只需要把 α/2 变成 α 就行
假设检验
假设检验的结果可能犯两类错误:
- 第一类错误(弃真):当原假设 H0 为真时,作出的决定却是拒绝 H0 ,犯这
类错误的概率不超过显著性水平 α ,
P{拒绝H0∣H0为真}=α
- 第二类错误(取伪):当原假设 H0 为假时,作出的决定却是接受 H0 ,犯这
类错误的概率记为 β ,
P{接受H0∣H0为假}=β
| H0 为真 | H0 为假 |
---|
接受 | 正确 | 第二类错误 |
拒绝 | 第一类错误 | 正确 |
检验 μ
- 提出假设 H0:μ=μ0,H1:μ=μ0
- 选检验统计量
- 方差已知,选 σ/nXˉ−μ∼N(0,1),进行 U 检验
- 方差未知,选 S/nXˉ−μ∼t(n−1),进行 T 检验
- 求拒绝域
- 方差已知,拒绝域 W=(−∞,−u2α)∪(u2α,+∞)
- 方差未知,拒绝域 W=(−∞,−t2α(n−1))∪(t2α(n−1),+∞)
- 做出检验:将 Xˉ 和 S 代入枢轴量,若在拒绝域 W 内,则拒绝 H0
检验 σ2
- 提出假设 H0:σ=σ0,H1:σ=σ0
- 选检验统计量 σ2(n−1)S2∼χ2(n−1),进行 χ2 检验
- 求拒绝域 W=(−∞,χ1−2α2(n−1))∪(χ2α2(n−1),+∞)
- 做出检验:将 S 代入枢轴量,若在拒绝域 W 内,则拒绝 H0
参考和注解