F(x)=⎩⎪⎪⎨⎪⎪⎧0b−ax−a1x<aa⩽x<bx⩾b
指数分布
f(x)=⎩⎨⎧θ1e−θx0x>0,其中θ为常数其他
F(x)={1−e−θx0x>0其他
正态分布 X∼N(μ,σ2)
f(x)=σ2π1e−2σ2(x−μ)2
F(x)=σ2π1∫−∞xexp(−2σ2(t−μ)2 )dt.
位置参数μ决定中心位置, 尺度参数σ越大曲线越矮越胖
标准正态分布 X∼N(0,1)
μ=0, σ=1
φ(x)=f(x)=2π1exp(−2t2)dt
Φ(x)=F(x)=2π1∫−∞xexp(−2t2)dt
相互独立的随机变量
F(x,y)=FX(x)⋅FY(y)P(x,y)=PX(x)⋅PY(y)f(x,y)=fX(x)⋅fY(y)
两个随机变量函数的分布
Z=X+Y分布
FZ(z)=P(Z⩽z)=∬x+y⩽zf(x,y)dxdy
卷积公式 当X ,Y相互独立时
fX∗fY=∫−∞+∞fX(x)⋅fY(z−x)dx=∫−∞+∞fX(z−y)⋅fY(y)dy
多维随机变量及其分布
二维随机变量 同一个样本空间中的随机变量X,Y组成的向量(X,Y)
二维随机变量分布函数
F(x,y)=P(X⩽x,Y⩽y)
满足单调性, 有界性, 右连续性, 非负性
二维离散型随机变量
(x,y)取值为有限多对或可列无限多对, 则(X,Y)为二维离散型随机变量
联合分布律
X \ Y |
y0 |
y1 |
⋯ |
yj |
⋯ |
x0 |
p00 |
p01 |
⋯ |
p00 |
⋯ |
x1 |
p10 |
p11 |
⋯ |
p1j |
⋯ |
⋮ |
⋮ |
⋮ |
⋱ |
⋮ |
⋱ |
xi |
pi0 |
pi1 |
⋯ |
pij |
⋯ |
⋮ |
⋮ |
⋮ |
⋮ |
⋮ |
⋱ |
非负性 pij⩾0
正则性 ∑i∑jpij=1
联合分布函数
P(X\leqslant x,Y\leqslant y)=F(x,y)=
\sum_{
\begin{subarray}{1}
x_i \leqslant x \\
y_j \leqslant y
\end{subarray}}
p_{ij}
二维连续型随机变量
联合概率密度函数 非负二元函数f(x,y), 有
F(x,y)=∫−∞x∫−∞yf(x,y)dxdy
非负性 f(x,y)⩾0
规范性 ∫−∞+∞∫−∞+∞f(x,y)dxdy=1
联合分布函数 F(x,y)
边缘分布
边缘分布函数
FX(x)=F(x,+∞)FY(y)=F(+∞,y)
条件分布
离散型随机变量 给定X求Y或给定Y求X
连续型随机变量 取极限
FX∣Y(x∣y)=P(X⩽x ∣ Y=y)
相互独立的随机变量
F(x,y)=FX(x)⋅FY(y)
离散型 直接计算
连续型
f(x,y)=fX(x)⋅fY(y)
两个随机变量的函数分布
Z=X+Y分布
FZ(z)=P(Z⩽z)=∬x+y⩽zf(x,y)dxdy
fZ(z)=∫−∞+∞f(z−y,y)dx=∫−∞+∞f(x,z−x)dy
当X与Y相互独立时,有卷积公式
fZ(z)=fX(x)∗fY(y)=∫−∞+∞fX(z−y)fY(y)dy=∫−∞+∞fY(z−x)fX(x)dx
Z=X/Y分布
FZ(z)=P(Z⩽z)=∬yx⩽zf(x,y)dxdy
相互独立时, 有:
fZ(z)=∫−∞+∞∣y∣fX(yz)⋅fY(y)dy
最大最小值分布
M=max{X,Y}N=min{X,Y}
则X,Y相互独立时
FM(m)=FX(m)⋅FY(m)FN(n)=1−[1−FX(n)]−[1−FY(n)]
随机变量的数字特征
数学期望
对于离散型随机变量X, 分布律P(X=xk)=pk,k=1,2,⋯, 若级数∑k=1∞xkpk绝对收敛, 则
E(X)=k=1∑∞xkpk
对于连续型随机变量X, 概率密度f(x)
E(X)=∫−∞+∞xf(x)dx
数学期望简称期望或均值
随机变量函数的数学期望
离散型 若∑k=1∞g(xk)pk绝对收敛,则
E(Y)=E(g(x))=k=1∑∞g(xk)pk
连续型 若∫−∞+∞g(x)f(x)dx绝对收敛, 则
E(Y)=E(g(x))=∫−∞+∞g(x)f(x)dx
n维度连续型
E(X)=∫−∞+∞∫−∞+∞xf(x,y)dxdyE[g(X,Y)]=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
性质
- C为常数则E(C)=C
- E(CX)=CE(X)
- E(X1+X2+⋯+Xn)=∑E(Xi)
- E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn)
方差与矩
方差 若期望存在,则
D(X)=E(X−E(X))2
标准差/均方差 D(X)
矩 若E(xk)存在, 则其k阶矩
μk=E(Xk)
离散型随机变量
D(x)=k=1∑∞[xk−E(X)]2pk
连续型随机变量
D(x)=∫−∞+∞[x−E(X)]2f(x)dx
另,
D(X)=E(X2)−[E(X)]2
正态分布X∼N(μ,σ2)中, μ为数学期望, σ2为方差
性质
- 若C为常数, D(C)=0
- D(CX)=C2D(X)
- D(X1+X2+⋯+Xn)=∑D(Xi)
- D(X)=0⟺P(X=E(x))=1
切比雪夫不等式 若随机变量方差与期望均存在, 对∀ε>0
P(∣X−E(X)∣⩾ε)⩽ε2D(X)
协方差
二维随机变量(X,Y), 若存在则
cov(X,Y)=E[(X−E(X))(Y−E(Y))]
常用公式
cov(X,Y)=E(XY)−E(X)⋅E(Y)
性质
- cov(X,X)=D(X)
- cov(X,C)=0
- cov(X,Y)=cov(Y,X)
- cov(aX,bY)=abcov(X,Y)
- cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)
- D(X+Y)=D(X)+D(Y)+2cov(X,Y)
相关系数
二维随机变量(X,Y), D(X)=0且 D(Y)=0时
ρXY=D(X)⋅D(Y)cov(X,Y)
∣ρ∣⩽1
线性相关系数 ∣ρ∣=1⟺P(Y=aX+b)=1,a=0
极限定理
概率收敛 设Y1,Y2,⋯,Yn,⋯是随机变量序列且对常数a, ∀ε>0有
n→∞limP(∣Yn−a∣⩾ε)=0orn→∞limP(∣Yn−a∣<ε)=1
则随机序列概率收敛到常数a, 记作
YnPa
大数定律
贝努利大数定律 设X1,X2,⋯,Xn,⋯是相互独立的随机变量序列且均服从以p为参数的**(0-1)分布**, 则
n1k=1∑nXkPp
切比雪夫大数定律特例 设X1,X2,⋯,Xn,⋯是相互独立的随机变量序列且数学期望与方差相同, E(Xk)=μ, D(Xk)=σ2 (k=1,2,⋯), 则
n1k=1∑nXkPμ
辛钦大数定律 设X1,X2,⋯,Xn,⋯是相互独立的随机变量序列且服从相同的分布, 并且存在数学期望E(Xk)=μ, 则
n1k=1∑nXkPμ
中心极限定理
数理统计
数理统计相比于概率论, 研究的都是分布未知的随机变量
基本概念
总体 研究对象某个指标值得全体称为总体
个体 总体中的每个元素
抽样 按一定规则从总体中抽取若干个体的过程
样本 所抽取的个体
样本容量 样本中所包含的个体数
样本应该具有随机性, 独立性
常见统计量
统计量 样本的函数
样本均值 Xˉ
Xˉ=n1i=1∑nXi
偏差 样本中数据与样本均值的差Xi−Xˉ
性质 偏差和为0 ∑(Xi−Xˉ)=0
样本均值的抽样分布 若总体分布为N(μ,σ2), 则Xˉ∼N(μ,nσ2); 若总体不为正态分布但期望为μ,方差为σ2则Xˉ近似分布$ N(\mu,\dfrac{\sigma^2}{n})$
样本方差 S2
S2=n−11i=1∑n(Xi−Xˉ)2
样本标准差 S=S2
四大统计量及其分布
卡方分布/χ2分布 对来自正态总体N(0,1)的样本X1,X2,⋯,Xn, 统计量χ2=∑i=1nXi2服从自由度为n的卡方分布, 记作
χ2∼χ2(n)
E(χ2)=n
D(χ2)=2n
n>45时分位点近似公式χα2(n)≈n+2n⋅zα, zα为标准正态分布的分位点,
P(χ2>χα2(n))=∫χα2(n)+∞f(x)dx
t分布/学生分布 X∼N(0,1), Y∼χ2(n), X,Y独立, t=nYX
t∼t(n)
分位点
P(t>tα(n))=∫tα(n)+∞h(t)dt
-
n>45时, tα(n)≈zα
-
n⩽45时, 查表
F分布 X ~ F(n1, n2)
正态总体相关四定理 对于来自正态总体X∼N(μ,σ2)的样本X1,X2,⋯,Xn, 有
Xˉ∼N(μ,nσ2) or σ/nXˉ−μ∼N(0,1)S/nXˉ−μ∼t(n−1)σ2(n−1)S2=σ2∑i=1n(Xi−Xˉ)2∼χ2(n−1)Xˉ与S2相互独立
参数估计
矩估计
步骤 估k个待估参数
-
求前k阶矩,
-
用样本矩带入μi
Mi=n1j=1∑nXji=μi
-
解方程
极大似然估计
步骤 求极大似然函数的最大值
- 写出极大似然函数
- 利用偏导或lnF的偏导求最值
点估计优良性
无偏性 E(θ^)=θ
有效性 若θ^1,θ^2都是无偏估计, 若D(θ^1−θ)<D(θ^2−θ)则θ^1更比2有效
相合性 若n→∞, ∀ε>0
n→∞limP(∣θ^n−θ∣<ε)=1
区间估计
P(θ<θ<θ)=1−α
置信区间 (θ,θ)
置信上限 θ
置信下限 θ
置信度/置信概率 1−α
正态总体均值
单个正态总体 μ
两个正态总体 μ1−μ2
-
σ12,σ22均已知
(Xˉ−Yˉ±n1σ12+n2σ22⋅z2α)
-
σ12=σ22=σ2但未知
(Xˉ−Yˉ±Swn11+n21⋅t2α(n1+n2−2))
正态总体方差
单个正态总体
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
(0-1)分布总体方差
(n+z2α2)p2−(2nXˉ+z2α2)p+nXˉ2=0
解方程得到
(p1,p2)
假设检验
一般步骤
- 提出原假设H0及备择假设H1
- 给定显著性水平α及样本容量n
- 提出拒绝域的形式并确定检验统计量
- 由P(拒绝H0 ∣ H0为真)=α求表达式
- 对总体抽样判断是否接受假设
单个正态总体的假设检验
μ的假设检验 H0:μ=μ0的拒绝域
-
σ2已知
∣σ/nXˉ−μ0∣>z2α
-
σ2未知
∣t∣=∣S/nXˉ−μ0∣>t2α(n−1)
σ2的假设检验 H0:σ2=σ02的拒绝域
χ2=σ02(n−1)S2∈(0,χ1−2α2(n−1))∪(χ2α2(n−1),+∞)
单边假设检验 H0:μ⩾μ0的拒绝域
xˉ−μ0<−nσ0⋅zα
两个正态总体的假设检验
方差已知均值的假设检验 H0:μ1=μ2
∣U∣=∣n1σ12−n2σ22xˉ−yˉ∣>z2α
均值未知总体方差的检验 H0:σ12=σ22的拒绝域
S22S12∈(0,F1−2α(n1−1,n2−1))∪(F2α(n1−1,n2−1),+∞)
分布拟合检验
当n⩾50时(充分大时),
δ