概率论与数理统计

概率论

连续型随机变量分布

分布名称概率密度函数(PDF)分布函数(CDF)期望 E[X]\mathbb{E}[X]方差 D[X]\mathrm{D}[X]参数说明
均匀分布 U(a,b)U(a, b)f(x)=1ba, axbf(x) = \frac{1}{b - a},\ a \le x \le bF(x)=xaba, axbF(x) = \frac{x - a}{b - a},\ a \le x \le ba+b2\frac{a + b}{2}(ba)212\frac{(b - a)^2}{12}a<ba < b
指数分布 Exp(λ)\text{Exp}(\lambda)f(x)=λeλx, x0f(x) = \lambda e^{-\lambda x},\ x \ge 0F(x)=1eλx, x0F(x) = 1 - e^{-\lambda x},\ x \ge 01λ\frac{1}{\lambda}1λ2\frac{1}{\lambda^2}λ>0\lambda > 0
正态分布 N(μ,σ2)N(\mu, \sigma^2)f(x)=12πσ2e(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }μ\muσ2\sigma^2μR, σ>0\mu \in \mathbb{R},\ \sigma > 0

离散型随机变量分布

分布名称概率质量函数(PMF)分布函数(CDF)期望 E[X]\mathbb{E}[X]方差 D[X]\mathrm{D}[X]参数说明
伯努利分布P(X=1)=p, P(X=0)=1pP(X=1) = p,\ P(X=0) = 1 - pF(x)={0x<01p0x<11x1F(x) = \begin{cases} 0 & x < 0 \\ 1 - p & 0 \le x < 1 \\ 1 & x \ge 1 \end{cases}ppp(1p)p(1 - p)0<p<10 < p < 1
二项分布 B(n,p)\text{B}(n, p)P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k}p^k(1 - p)^{n - k}累加 PMFnpnpnp(1p)np(1 - p)nN, 0<p<1n \in \mathbb{N},\ 0 < p < 1
几何分布P(X=k)=(1p)k1p, k=1,2,...P(X = k) = (1 - p)^{k - 1} p,\ k = 1,2,...F(k)=1(1p)kF(k) = 1 - (1 - p)^k1p\frac{1}{p}1pp2\frac{1 - p}{p^2}0<p<10 < p < 1
泊松分布 π(λ)\pi(\lambda)P(X=k)=λkeλk!, k=0,1,2,P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!},\ k = 0,1,2,\dots累加 PMFλ\lambdaλ\lambdaλ>0\lambda > 0

二项分布的众数为 (n+1)p\lfloor(n+1)p\rfloor

二项分布的极限情况就是泊松分布,此时,

  • n+n\to+\infty
  • p0p\to 0
  • npλnp\to \lambda

标准正态分布

XN(μ,σ2)XμσN(0,1)\begin{align*} X &\sim \mathcal N (\mu, \sigma^2)\\ \frac{X-\mu}{\sigma}&\sim \mathcal N(0, 1) \end{align*}

  • μ=0\mu=0
  • σ=1\sigma=1

f(x)=12πex22f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}

EX2=1\mathbb EX^2=1

X,YN(μi,σi)X, Y\sim\mathcal N(\mu_i, \sigma_i) 且相互独立,则有:

  • E(XY)=Cov(X,Y)+μXμY=μXμY\mathbb E(XY)=\mathrm{Cov}(X, Y)+\mu_X\mu_Y=\mu_X\mu_Y
  • D(XY)=μX2σY2+μY2σX2+σX2σY2\mathrm D(XY)=\mu_X^2\sigma_Y^2+\mu_Y^2\sigma_X^2+\sigma_X^2\sigma_Y^2
  • XYXY 一般不再是正态分布

Gauss 积分

+ex2dx=π\int_{-\infty}^{+\infty} e^{-x^2}\mathrm{d}x=\sqrt \pi

随机变量函数的分布

ifx=g(y)andf(x) 为 X 的 PMF, g(y) 单调, thenfY(y)=fX(g(y))g(y)\text{if}\quad x=g(y)\quad\text{and}\quad f(x) \text{ 为 } X \text{ 的 PMF, }g(y)\text{ 单调, then}\\ f_Y(y)=f_X(g(y))g'(y)

另外注意上下限

二维正态分布

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim\mathcal N(\mu_1,\mu_2,\sigma^2_1,\sigma^2_2,\rho)

f(x,y)=12πσ1σ21ρ2e121ρ2((xμ1)2σ12+(xμ2)2σ222ρ(xμ1)(yμ2)σ1σ2)f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2\sqrt{1-\rho^2}}(\frac{(x-\mu_1)^2}{\sigma_1^2}+\frac{(x-\mu_2)^2}{\sigma_2^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2})}

正态分布满足可加性

XiN(μi,σi2)X_i\sim \mathcal N(\mu_i,\sigma_i^2)

ciXiN(ciμi,ci2σi2)\sum c_iX_i\sim \mathcal N(\sum c_i\mu_i,\sum \textcolor{red}{ c_i^2}\sigma_i^2)

二维随机变量函数的分布

注意这里涉及到的都是 CDF

Z=X+YZ=X+Y

FZ(z)=P(Zz)=P(X+Yz)=x+yzf(x,y)dxdy=+[zxf(x,y)dy]dx=+f(x,zx)dx=+f(zy,y)dy\begin{align*} F_Z(z)=P(Z\le z)&=P(X+Y\le z)\\ &=\iint \limits_{x+y\le z}f(x,y)\mathrm dx\mathrm dy\\ &=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)\mathrm dy]\mathrm dx\\ &=\boxed{\int_{-\infty}^{+\infty}f(x,z-x)\mathrm dx}\\ &=\boxed{\int_{-\infty}^{+\infty}f(z-y,y)\mathrm dy}\\ \end{align*}

Z=max(X,Y)Z=\max(X,Y)Z=min(X,Y)Z=\min(X,Y)

独立同分布,则有

Fmax(z)=P(Zz)=P(Zx)P(zy)=FX(z)FY(z)=F2(z)F_{\max} (z)=P(Z\le z)=P(Z\le x)P(z\le y)=\boxed{F_X(z)F_Y(z)=F^2(z)}

Fmin(z)=1P(Zz)=1P(Zx)P(zy)=1[1FX(z)][1FY(z)]=1[1F(z)]2F_{\min} (z)=1-P(Z\ge z)=1-P(Z\ge x)P(z\ge y)=\boxed{1-[1-F_X(z)][1-F_Y(z)]=1-[1-F(z)]^2}

随机变量的数字特征

EX\mathbb{E}X

  • 离散型随机变量 EX=xipi\mathbb EX=\sum x_ip_i
  • 连续型随机变量 EX=xf(x)dx\mathbb EX=\int xf(x)\mathrm dx

线性性质:

  • E(c)=cc 为常数\mathbb E(c)=c\quad c \text{ 为常数}

  • E(aX+bY)=aEX+bEY\mathbb E(aX+bY)=a\mathbb EX+b\mathbb EY

  • E(XY)=EXEYX,Y 相互独立\mathbb E(XY)=\mathbb EX \mathbb EY \quad X, Y \text{ 相互独立}

E(g(X))=g(x)×P{x=Xi}=g(x)f(x)dx\begin{align*} \mathbb E(g(X))&=\sum g(x)\times P\{x=X_i\}\\ &=\int g(x)f(x)\mathrm dx \end{align*}

DX\mathrm DX

DX=E(X2)(EX)2\mathrm DX=\mathbb E(X^2)-(\mathbb EX)^2

  • D(aX+b)=a2DX\mathrm D(aX+b)=a^2\mathrm DX
  • D(X±Y)=DX+DY±2Cov(X,Y)\mathrm D(X\pm Y)=\mathrm DX+\mathrm DY\pm 2\mathrm{Cov}(X,Y)

标准差 σX=DX\sigma_X=\sqrt {\mathrm DX}

特别注意标准差和方差要不要开方

一般计算样本的方差使用的是无偏方差,注意分母不是 nn

S21n1i=1n(XiXˉ)2S^2\equiv \frac{1}{\textcolor{red}{n-1}}\sum_{i=1}^{n}(X_i-\bar X)^2

Cov(X,Y)\mathrm{Cov}(X,Y)

Cov(X,Y)=E(XY)EXEY\mathrm{Cov}(X,Y)=\mathbb E(XY)-\mathbb EX \mathbb EY

  • Cov(X,X)=DX\mathrm{Cov}(X,X)=\mathrm DX

线性性质:

  • Cov(X,c)=0\mathrm{Cov}(X,c)=0
  • Cov(aX,Y)=aCov(X,Y)\mathrm{Cov}(aX,Y)=a\mathrm{Cov}(X,Y)
  • Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)\mathrm{Cov}(X+Y,Z)=\mathrm{Cov}(X,Z)+\mathrm{Cov}(Y,Z)

ρXY\rho_{XY}

ρXY=Cov(X,Y)DXDY[1,1]\rho_{XY}=\frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm DX\mathrm DY}}\in[-1,1]

取值范围由 Cauchy-Schwarz 不等式得到,因为方差永远大于 00

[E(UV)]2E(U2)E(V2)[\mathbb E(UV)]^2\leq \mathbb E(U^2)\mathbb E(V^2)

特殊地,

ρXY=±1a,b, s.t. Y=aX+b\rho_{XY}=\pm1\Rightarrow \exists a,b,\text{ s.t. } Y=aX+b

σYσX=aandD(XY)=D(YX)=0\frac{\sigma_Y}{\sigma_X}=|a| \quad\text{and}\quad \mathrm D(X|Y)=\mathrm D(Y|X)=0

Chebyshev 不等式

P(Xμϵ)<σ2ϵ2P(|X-\mu|\ge \epsilon)<\frac{\sigma^2}{\epsilon^2}

大数定律

Xnˉ\bar{X_n} 为样本均值, ϵ>0\forall\epsilon>0,有

limn+P{Xnˉμ<ϵ}=1\lim\limits_{n\to+\infty}P\{|\bar{X_n}-\mu|<\epsilon\}=1

也就是说 n+n\to+\infty 时,样本均值依概率收敛于数学期望

中心极限定理

Xnˉ\bar{X_n} 为样本均值, ZnZ_n 为其标准化形式

Zn=XˉnE[Xˉn]D[Xˉn]=Xˉnμσ/nN(0,1)Z_n = \frac{\bar{X}_n - \mathbb{E}[\bar{X}_n]}{\mathrm{D}[\bar{X}_n]} = \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \sim \mathcal{N}(0,1)

也就是说,不管 XiX_i 服从什么分布,其样本均值的标准化形式 ZnZ_n 都服从标准正态分布,非标准化形式满足

XnˉN(μ,σ2n)\boxed{\bar{X_n}\sim\mathcal N(\mu,\frac{\sigma^2}{n})}

数理统计

正态总体

XnX_n 是从正态总体 N(μ,σ2)\mathcal N(\mu, \sigma^2) 中抽取的一群样本,则样本均值和样本方差满足以下说法: (Fisher’s Lemma)

  • XnˉN(μ,σ2n)\bar{X_n}\sim \mathcal N\left(\mu,\frac{\sigma^2}n\right)

    • EXnˉ=μ\mathbb E\bar{X_n}=\mu
    • DXnˉ=μ2n\mathrm D\bar{X_n}=\frac {\mu^2} {\sqrt n}
  • (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)

    • 注意, S2S^2 计算是使用的 Xˉ\bar X
    • 如果使用均值 μ\mu 计算方差,则不会损失自由度,它会遵从 χ2(n)\chi^2(n) 分布
    • ES2=σ2\mathbb ES^2=\sigma^2
    • DS2=2σ4n1\mathrm DS^2=\frac{2\sigma^4}{n-1}
  • S2S^2Xˉ\bar X相互独立的

χ2\chi^2 分布

X1,X2,,XkX_1,X_2,\dots,X_k 满足 XkN(0,1)X_k\sim\mathcal N(0,1),则

Z=Xiχ2(k)Z=\sum X_i\sim \chi^2(k)

  • EZ=k\mathbb EZ=k
  • DZ=2k\mathrm DZ=2k

ZiZ_i 独立同分布,则满足可加性:

Ziχ2(ki)\sum Z_i\sim \chi^2(\sum k_i)

tt 分布

  • ZN(0,1)Z\sim\mathcal N(0,1)
  • Uχ2(k)U\sim\chi^2(k)
  • 相互独立

T=ZU/kt(k)T=\frac{Z}{\sqrt{U/k}}\sim t(k)

  • ET=0if k>1\mathbb ET=0\quad \text{if } k>1
  • DT=kk2if k>2\mathrm DT=\frac{k}{k-2} \quad \text{if }k>2

k+k\to+\infty 时, tt 分布收敛于 N(0,1)\mathcal N(0,1)


对于从正态总体中抽取的样本 XiX_i,有,

Xˉnμσ/nN(0,1)(n1)S2σ2χ2(n1)\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \sim \mathcal{N}(0,1)\\ \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)

则,

T=XnˉμS/n=Xˉnμσ/nS2/σ2=Xˉnμσ/nχ2(n1)n1t(n1)\begin{align*} T&=\frac{\bar{X_n}-\mu}{S/\sqrt{n}}\\ &=\frac{\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}}}{\sqrt{S^2/\sigma^2}} \\ &=\frac{\textcolor{red}{\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}}}}{\textcolor{green}{\sqrt{\frac{\chi^2(n-1)}{n-1}}}} \sim t(n-1) \end{align*}

FF 分布

  • Uχ2(d1)U\sim \chi^2(d_1)
  • Vχ2(d2)V\sim\chi^2(d_2)
  • 相互独立

F=U/d1V/d2F(d1,d2)F=\frac{U/d_1}{V/d_2}\sim F(d_1,d_2)

if Tt(k), thenT2F(1,k)\text{if } T\sim t(k)\text{, then}\\ T^2\sim F(1,k)

点估计法

矩估计法

核心思想:令

EXt(θ)=Xntˉ\mathbb EX^t(\theta)=\bar{X_n^t}

求解出矩估计量 θ^=f(xˉ)\hat \theta=f(\bar x)

最大似然估计法

核心思想:令

L(θ)=p(xi;θ)={P{X=xi;θ}离散型随机变量f(xi;θ)连续型随机变量L(\theta)=\prod p(x_i;\theta)= \left\{ \begin{aligned} &\prod P\{X=x_i;\theta\} &\quad \text{离散型随机变量} \\ &\prod f(x_i;\theta) &\quad \text{连续型随机变量} \end{aligned} \right.

取对数后求其驻点

dlnL(θ)dθ=p(xi;θ)p(xi;θ)=0\frac{\mathrm d \ln L(\theta)}{\mathrm d\theta}=\sum \frac{p'(x_i;\theta)}{p(x_i;\theta)}=0

如果有多个最大似然估计量,例如正态分布的 μ\muσ2\sigma^2,则需要求它们的偏导,组成一个方程组

{lnL(θi)θ1=0lnL(θi)θ2=0lnL(θi)θn=0\left\{ \begin{aligned} \frac{\partial \ln L(\theta_i)}{\partial \theta_1} &= 0 \\ \frac{\partial \ln L(\theta_i)}{\partial \theta_2} &= 0 \\ \dots\\ \frac{\partial \ln L(\theta_i)}{\partial \theta_n} &= 0 \end{aligned} \right.

更严谨的话还要检查一下 Hessian 矩阵


当似然函数满足:

  • 是单调函数
  • xix_i 依赖于待估计的参数

时,参数的最大似然估计值可以是 max{Xi}\max \{X_i\}min{Xi}\min \{X_i\}

例如均匀分布,观察值 XiX_i 必须处在某和 θ\theta 相关的区间内时会涉及到这种情况

估计量评选标准

无偏性

Eθ^=θ\mathbb E\hat \theta=\theta

则称 θ^\hat\thetaθ\theta 的无偏估计量


一些无偏估计量

  • EXnˉ=μ\mathbb E\bar{X_n}=\mu
  • ES2=σ2\mathbb ES^2=\sigma^2,若样本方差计算使用的不是无偏方差,则它不是无偏的估计量

有效性

θi^\hat{\theta_i}θj^\hat{\theta_j} 都是 θ\theta 的无偏估计量

Dθi^Dθj^\mathrm D\hat{\theta_i}\le \mathrm D\hat{\theta_j}

则称 θi^\hat{\theta_i}θj^\hat{\theta_j} 更有效

一致性

n+n\to +\infty 时,估计量 θn^\hat{\theta_n} 依概率收敛于 θ\theta,即

ϵ>0,limn+P{θn^θ<ϵ}=1\forall \epsilon>0, \lim\limits_{n\to+\infty} P\{|\hat{\theta_n}-\theta|<\epsilon \}=1

则称 θn^\hat{\theta_n}θ\theta 的一致估计量

区间估计法

注意分位点是一个坐标,而不是长度

μ\mu

  • 若方差已知,则 1α1-\alpha 下,枢轴量 Xˉμσ/nN(0,1)\frac{\bar X-\mu}{\sigma/\sqrt n}\sim\mathcal N(0,1) 需要在 (uα2,uα2)(-u_{\frac{\alpha}{2}},u_{\frac{\alpha}{2}}) 区间内,求解出 μ\mu 的置信区间为

μ(Xˉ±uα2σn)\mu\in\boxed{(\bar X\pm u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt n})}

  • 若方差未知,则 1α1-\alpha 下,枢轴量 XˉμS/nt(n1)\frac{\bar X-\mu}{S/\sqrt n}\sim t(n-1) 需要在 (tα2(n1),tα2(n1))(-t_{\frac{\alpha}{2}}(n-1), t_{\frac{\alpha}{2}}(n-1)) 区间内,求解出 μ\mu 的置信区间为

μ(Xˉ±tα2(n1)Sn)\mu\in\boxed{(\bar X\pm t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt n})}

σ2\sigma^2

  • 若期望未知,则 1α1-\alpha 下,枢轴量 (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) 需要在 (χ1α22(n1),χα22(n1))(\chi^2_{1-\frac{\alpha}{2}}(n-1),\chi^2_{\frac{\alpha}{2}}(n-1)) 区间内,求解出 σ\sigma 的置信区间为

σ2((n1)S2χα22(n1),(n1)S2χ1α22(n1))\sigma^2\in\boxed{(\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)})}

  • 若期望已知,则

σ2((Xiμ)2χα22(n1),(Xiμ)2χ1α22(n1))\sigma^2\in\boxed{(\frac{\sum(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\frac{\sum(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)})}


求单侧置信区间只需要把 α/2\alpha/2 变成 α\alpha 就行

假设检验

假设检验的结果可能犯两类错误:

  • 第一类错误(弃真):当原假设 H0H_0 为真时,作出的决定却是拒绝 H0H_0 ,犯这
    类错误的概率不超过显著性水平 α\alpha

P{拒绝H0H0为真}=αP\{拒绝H_0\mid H_0为真\}=\alpha

  • 第二类错误(取伪):当原假设 H0H_0 为假时,作出的决定却是接受 H0H_0 ,犯这
    类错误的概率记为 β\beta

P{接受H0H0为假}=βP\{接受H_0\mid H_0为假\}=\beta

H0H_0 为真H0H_0 为假
接受正确第二类错误
拒绝第一类错误正确

检验 μ\mu

  1. 提出假设 H0:μ=μ0H_0: \enspace \mu=\mu_0H1:μμ0H_1: \enspace \mu\ne\mu_0
  2. 选检验统计量
    • 方差已知,选 Xˉμσ/nN(0,1)\boxed{\frac{\bar X-\mu}{\sigma/\sqrt n}}\sim\mathcal N(0,1),进行 U 检验
    • 方差未知,选 XˉμS/nt(n1)\boxed{\frac{\bar X-\mu}{S/\sqrt n}}\sim t(n-1),进行 T 检验
  3. 求拒绝域
    • 方差已知,拒绝域 W=(,uα2)(uα2,+)W=(-\infty,-u_{\frac{\alpha}{2}})\cup(u_{\frac{\alpha}{2}},+\infty)
    • 方差未知,拒绝域 W=(,tα2(n1))(tα2(n1),+)W=(-\infty,-t_{\frac{\alpha}{2}}(n-1))\cup(t_{\frac{\alpha}{2}}(n-1),+\infty)
  4. 做出检验:将 Xˉ\bar XSS 代入枢轴量,若在拒绝域 WW 内,则拒绝 H0H_0

检验 σ2\sigma^2

  1. 提出假设 H0:σ=σ0H_0: \enspace \sigma=\sigma_0H1:σσ0H_1: \enspace \sigma\ne\sigma_0
  2. 选检验统计量 (n1)S2σ2χ2(n1)\boxed{\frac{(n-1)S^2}{\sigma^2}}\sim \chi^2(n-1),进行 χ2\chi^2 检验
  3. 求拒绝域 W=(,χ1α22(n1))(χα22(n1),+)W=(-\infty,\chi^2_{1-\frac{\alpha}{2}}(n-1))\cup(\chi^2_{\frac{\alpha}{2}}(n-1),+\infty)
  4. 做出检验:将 SS 代入枢轴量,若在拒绝域 WW 内,则拒绝 H0H_0

参考和注解


概率论与数理统计
https://blog.kisechan.space/2025/notes-ptms/
作者
Kisechan
发布于
2025年6月15日
更新于
2025年6月27日
许可协议