概率论

随机事件与概率

随机事件

随机试验(Experiment) 满足可重复进行, 结果明确且不止一个, 结果无法预测试验, 记作EE

样本空间 随机试验所有结果的集合, 记作SSΩ\varOmega

样本点 样本空间中的元素, 即随机试验的每一个结果, 记作eeω\omega

随机事件 随机试验样本空间的子集, 用A,B,C,A,B,C,\cdots表示

基本事件 只包含一个样本点的随机事件

不可能事件 \varnothing, 一个样本点都不包含的随机事件

必然事件 SS

事件满足集合运算, 特别的, AB=ABA\cap B=AB, 对立事件Aˉ\bar A

概率

频率 nn次试验中随机事件AA发生了nAn_A次, 则其频率记作

fn(A)=nAnf_n(A)=\dfrac{n_A}{n}

非负 0fn(A)10\leq f_n(A)\leq1

规范 fn(S)=1f_n(S)=1

可加 fn(A1A2An)=fn(A1)+fn(A2)++fn(An), (Ai)f_n(A_1\cup A_2\cup \cdots\cup A_n)=f_n(A_1)+f_n(A_2) +\cdots+f_n(A_n),\ (A_i两两不相容)

概率EE的每一个事件AA赋予一个实数P(A)P(A)即为AA的概率

非负 0P(A)10\leq P(A)\leq1

规范 P(S)=1P(S)=1

可列可加 P(A1A2An)=P(A1)+P(A2)++P(An), (Ai)P(A_1\cup A_2\cup \cdots\cup A_n)=P(A_1)+P(A_2) +\cdots+P(A_n),\ (A_i两两不相容)

相关性质如下:

P(AB)=P(A)P(B)P(A+B)=P(A)+P(B)P(AB)P(Aˉ)=1P(A)P(A-B)=P(A)-P(B) \\ P(A+B)=P(A)+P(B)-P(AB) \\ P(\bar A)=1-P(A)

古典概型 (等可能概型)

P(A)=knP(A)=\dfrac{k}{n}

其中nn为样本点总数, kkAA包含的样本数

条件概率

P(AB)=P(AB)P(B)P(A|B)=\dfrac{P(AB)}{P(B)}

BB发生的情况下AA的概率

全概率公式

样本空间SS的划分B1,B2,,BnB_1,B_2,\cdots , B_n称为样本空间的互斥完备事件组, 则有

P(A)=i=1nP(Bi)P(ABi)P(A)=\sum_{i=1}^nP(B_i)P(A|B_i)

Polya模型 有无放回地取球概率相等

贝叶斯公式

样本空间SS有划分B1,B2,,BnB_1,B_2,\cdots , B_n, 则有

P(BiA)=P(Bi)P(ABi)j=1nP(Bj)P(ABj)P(B_i|A)=\dfrac{P(B_i)P(A|B_i)}{\sum_{j=1}^nP(B_j)P(A|B_j)}

事件独立性

两两独立 P(AB)=P(A)P(B)P(AB)=P(A)P(B)

相互独立 三个事件两两独立的基础上P(A)P(B)P(C)=P(ABC)P(A)P(B)P(C)=P(ABC)

A,B,CA,B,C两两独立不能证明其相互独立

一维随机变量及其分布

离散型随机变量 随机变量XX的取值是可列的或有限个的

连续型随机变量 随机变量XX的可能取值是数轴或至少有一部分取值是某个区间

离散型随机变量

分布律XX所有可能取值xkx_k, xkx_k被取到的概率pkp_k, (k=1,2,3,)(k=1,2,3,\cdots), 则

XX x1x_1 x2x_2 \cdots xnx_n \cdots
pkp_k p1p_1 p2p_2 \cdots pnp_n \cdots

非负性 $p_k\geqslant 0 $

完备性 i=1+infpk=1\sum_{i=1}^{+\inf}p_k=1

特殊分布

(0-1)分布 也叫两点分布, 随机变量只能取0,1两个值

二项分布 由贝努利概型,若随机变量可能取值为0,1,2,,n0, 1, 2,\cdots,n得到的分布XB(n,p)X\sim B(n,p)

贝努利概型 nn次重复, 结果独立且只有AAAˉ\bar A两种的试验为贝努利试验, nn为贝努里概型

贝努利定理 p=P(A)p=P(A),nn次试验中AA发生kk次的概率Pn(k)P_n(k)满足

Pn(k)=Cnkpk(1p)nkP_n(k)=C_n^kp^k(1-p)^{n-k}

泊松 (Poisson) 定理λ=npn\lambda=n\cdot p_n, 则

limnPn(k)=λkeλk!\lim\limits_{n\to \infty}P_n(k)=\dfrac{\lambda^ke^{-\lambda}}{k!}

泊松分布 若随机变量可能取值为0,1,2,0, 1, 2,\cdots,则根据泊松定理有泊松分布XP(λ)X\sim P(\lambda)

随机变量分布函数

XX为一个随机变量, 则F(x)=P(Xx)F(x)=P(X\leqslant x)

单调性 F(x)F(x)是在实数轴上单调非减的函数

有界性 对任意xx0F(x)10\leqslant F(x)\leqslant 1, limxF(x)=0\lim\limits_{x\to-\infty}F(x)=0, limx+F(x)=1\lim\limits_{x\to+\infty}F(x)=1

右连续性 limxx0F(x)=F(x0)\lim\limits_{x\to x_0}F(x)=F(x_0)

连续性随机变量

概率密度函数 非负函数f(x)f(x)使得F(X)=xf(t)dtF(X)=\int_{-\infty}^xf(t)dt, 则这个函数为概率密度函数

非负性 f(x)0f(x)\geqslant0

正则性 +f(x)dx=1\int_{-\infty}^{+\infty}f(x)dx=1

F(x)F(x)xx上连续则F(x)=f(x)F'(x)=f(x)

P(x1Xx2)=F(x2)F(x1)=x1x2f(x)dxP(x_1\leqslant X\leqslant x_2)=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)dx

均匀分布 bbaa上的自由分布

f(x)=\ \begin{cases} \dfrac{1}{b-a} &aF(x)={0x<axabaax<b1xbF(x)= \begin{cases} 0 & x<a \\ \dfrac{x-a}{b-a} & a\leqslant x<b \\ 1 & x\geqslant b \end{cases}

指数分布

f(x)={1θexθx>0,其中θ为常数0其他f(x)= \begin{cases} \dfrac{1}{\theta}e^{-\frac{x}{\theta}} & x>0,\text{其中}\theta\text{为常数} \\ 0 &\text{其他} \end{cases}

F(x)={1exθx>00其他F(x)= \begin{cases} 1-e^{-\frac{x}{\theta}} & x>0\\ 0 & \text{其他} \end{cases}

正态分布 XN(μ,σ2)X\sim N(\mu,\sigma^2)

f(x)=1σ2π  e(xμ)22σ2f(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}\;e^{-{\frac {\left(x-\mu \right)^{2}}{2\sigma ^{2}}}}

F(x)=1σ2πxexp((tμ)22σ2 )dt.F(x) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^x \exp \left( -\frac{(t - \mu)^2}{2\sigma^2} \ \right)\, dt.

位置参数μ\mu决定中心位置, 尺度参数σ\sigma越大曲线越矮越胖

标准正态分布 XN(0,1)X\sim N(0,1)

μ=0\mu=0, σ=1\sigma=1

φ(x)=f(x)=12πexp(t22)dt\varphi(x)= f(x)= \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) \, dt

Φ(x)=F(x)=12πxexp(t22)dt\varPhi(x)= F(x)= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x \exp\left(-\frac{t^2}{2}\right) \, dt

相互独立的随机变量

F(x,y)=FX(x)FY(y)P(x,y)=PX(x)PY(y)f(x,y)=fX(x)fY(y)F(x,y)=F_X(x)\cdot F_Y(y) \\ P(x,y)=P_X(x)\cdot P_Y(y) \\ f(x,y)=f_X(x)\cdot f_Y(y)

两个随机变量函数的分布

Z=X+YZ=X+Y分布

FZ(z)=P(Zz)=x+yzf(x,y)dxdyF_Z(z)=P(Z\leqslant z)=\iint_{x+y\leqslant z}f(x,y)dxdy

卷积公式X ,YX\ ,Y相互独立时

fXfY=+fX(x)fY(zx)dx=+fX(zy)fY(y)dyf_X * f_Y=\int_{-\infty}^{+\infty}f_X(x)\cdot f_Y(z-x)\mathrm dx =\int_{-\infty}^{+\infty}f_X(z-y)\cdot f_Y(y)\mathrm dy

多维随机变量及其分布

二维随机变量 同一个样本空间中的随机变量X,YX,Y组成的向量(X,Y)(X,Y)

二维随机变量分布函数

F(x,y)=P(Xx,Yy)F(x,y)=P(X\leqslant x,Y\leqslant y)

满足单调性, 有界性, 右连续性, 非负性

二维离散型随机变量

(x,y)(x,y)取值为有限多对或可列无限多对, 则(X,Y)(X,Y)为二维离散型随机变量

联合分布律

XX \ YY y0y_0 y1y_1 \cdots yjy_j \cdots
x0x_0 p00p_{00} p01p_{01} \cdots p00p_{00} \cdots
x1x_1 p10p_{10} p11p_{11} \cdots p1jp_{1j} \cdots
\vdots \vdots \vdots \ddots \vdots \ddots
xix_i pi0p_{i0} pi1p_{i1} \cdots pijp_{ij} \cdots
\vdots \vdots \vdots \vdots \vdots \ddots

非负性 pij0p_{ij}\geqslant 0

正则性 ijpij=1\sum_i\sum_jp_{ij}=1

联合分布函数

P(X\leqslant x,Y\leqslant y)=F(x,y)= \sum_{ \begin{subarray}{1} x_i \leqslant x \\ y_j \leqslant y \end{subarray}} p_{ij}

二维连续型随机变量

联合概率密度函数 非负二元函数f(x,y)f(x,y), 有

F(x,y)=xyf(x,y)dxdyF(x,y)= \int_{-\infty}^{x} \int_{-\infty}^{y} f(x,y)\mathrm{d} x\mathrm{d} y

非负性 f(x,y)0f(x,y)\geqslant0

规范性 ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d} x\mathrm{d} y=1

联合分布函数 F(x,y)F(x, y)

边缘分布

边缘分布函数

FX(x)=F(x,+)FY(y)=F(+,y)F_X(x)=F(x,+\infty) \\ F_Y(y)=F(+\infty,y)

条件分布

离散型随机变量 给定XXYY或给定YYXX

连续型随机变量 取极限

FXY(xy)=P(Xx  Y=y)F_{X|Y}(x|y)=P(X\leqslant x\ |\ Y=y )

相互独立的随机变量

F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)\cdot F_Y(y)

离散型 直接计算

连续型

f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)\cdot f_Y(y)

两个随机变量的函数分布

Z=X+YZ=X+Y分布

FZ(z)=P(Zz)=x+yzf(x,y)dxdyF_Z(z)=P(Z\leqslant z)=\iint_{x+y\leqslant z}f(x,y)\mathrm{d}x\mathrm{d}y

fZ(z)=+f(zy,y)dx=+f(x,zx)dyf_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)\mathrm{d}x=\int_{-\infty}^{+\infty}f(x,z-x)\mathrm{d}y

XXYY相互独立时,有卷积公式

fZ(z)=fX(x)fY(y)=+fX(zy)fY(y)dy=+fY(zx)fX(x)dxf_Z(z)=f_X(x)*f_Y(y)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y=\int_{-\infty}^{+\infty}f_Y(z-x)f_X(x)\mathrm{d}x

Z=X/YZ=X/Y分布

FZ(z)=P(Zz)=xyzf(x,y)dxdyF_Z(z)=P(Z\leqslant z)=\iint_{\frac{x}{y}\leqslant z}f(x,y)\mathrm{d}x\mathrm{d}y

相互独立时, 有:

fZ(z)=+yfX(yz)fY(y)dyf_Z(z)=\int_{-\infty}^{+\infty}|y|f_X(yz)\cdot f_Y(y)\mathrm dy

最大最小值分布

M=max{X,Y}N=min{X,Y}M=\max\{X,Y\} \\ N=\min\{X,Y\}

则X,Y相互独立时

FM(m)=FX(m)FY(m)FN(n)=1[1FX(n)][1FY(n)]F_M(m)=F_X(m)\cdot F_Y(m) \\ F_N(n)=1-[1-F_X(n)]-[1- F_Y(n)]

随机变量的数字特征

数学期望

对于离散型随机变量XX, 分布律P(X=xk)=pk,k=1,2,P(X=x_k)=p_k,k=1,2,\cdots, 若级数k=1xkpk\sum_{k=1}^{\infty}x_kp_k绝对收敛, 则

E(X)=k=1xkpkE(X)=\sum_{k=1}^\infty x_kp_k

对于连续型随机变量XX, 概率密度f(x)f(x)

E(X)=+xf(x)dxE(X)=\int_{-\infty}^{+\infty}xf(x)\mathrm{d}x

数学期望简称期望或均值

随机变量函数的数学期望

离散型 若k=1g(xk)pk\sum_{k=1}^{\infty}g(x_k)p_k绝对收敛,则

E(Y)=E(g(x))=k=1g(xk)pkE(Y)=E(g(x))=\sum_{k=1}^{\infty}g(x_k)p_k

连续型 若+g(x)f(x)dx\int^{+\infty}_{-\infty}g(x)f(x)\mathrm dx绝对收敛, 则

E(Y)=E(g(x))=+g(x)f(x)dxE(Y)=E(g(x))=\int^{+\infty}_{-\infty}g(x)f(x)\mathrm dx

nn维度连续型

E(X)=++xf(x,y)dxdyE[g(X,Y)]=++g(x,y)f(x,y)dxdyE(X)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}xf(x,y)\mathrm dx\mathrm dy \\ E[g(X,Y)]=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)\mathrm dx\mathrm dy

性质

  • CC为常数则E(C)=CE(C)=C
  • E(CX)=CE(X)E(CX)=CE(X)
  • E(X1+X2++Xn)=E(Xi)E(X_1+X_2+\cdots+X_n)=\sum E(X_i)
  • E(X1X2Xn)=E(X1)E(X2)E(Xn)E(X_1X_2\cdots X_n)=E(X_1)E(X_2)\cdots E(X_n)

方差与矩

方差 若期望存在,则

D(X)=E(XE(X))2D(X)=E(X-E(X))^2

标准差/均方差 D(X)\sqrt {D(X)}

E(xk)E(x^k)存在, 则其kk阶矩

μk=E(Xk)\mu_k = E(X^k)

离散型随机变量

D(x)=k=1[xkE(X)]2pkD(x)=\sum_{k=1}^{\infty}[x_k-E(X)]^2p_k

连续型随机变量

D(x)=+[xE(X)]2f(x)dxD(x)=\int_{-\infty}^{+\infty}[x-E(X)]^2f(x)\mathrm dx

另,

D(X)=E(X2)[E(X)]2D(X)=E(X^2)-[E(X)]^2

正态分布XN(μ,σ2)X\sim N(\mu,\sigma^2)中, μ\mu为数学期望, σ2\sigma^2为方差

性质

  • CC为常数, D(C)=0D(C)=0
  • D(CX)=C2D(X)D(CX)=C^2D(X)
  • D(X1+X2++Xn)=D(Xi)D(X_1+X_2+\cdots+X_n)=\sum D(X_i)
  • D(X)=0    P(X=E(x))=1D(X)=0 \iff P(X=E(x))=1

切比雪夫不等式 若随机变量方差与期望均存在, 对ε>0\forall \varepsilon>0

P(XE(X)ε)D(X)ε2P(|X-E(X)|\geqslant\varepsilon)\leqslant\dfrac{D(X)}{\varepsilon^2}

协方差

二维随机变量(X,Y)(X,Y), 若存在则

cov(X,Y)=E[(XE(X))(YE(Y))]\mathrm{cov}(X,Y)=E[(X-E(X))(Y-E(Y))]

常用公式

cov(X,Y)=E(XY)E(X)E(Y)\mathrm{cov}(X,Y)=E(XY)-E(X)\cdot E(Y)

性质

  • cov(X,X)=D(X)\mathrm{cov}(X,X)=D(X)
  • cov(X,C)=0\mathrm{cov}(X,C)=0
  • cov(X,Y)=cov(Y,X)\mathrm{cov}(X,Y)=\mathrm{cov}(Y,X)
  • cov(aX,bY)=abcov(X,Y)\mathrm{cov}(aX,bY)=ab\mathrm{cov}(X,Y)
  • cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)\mathrm{cov}(X+Y,Z)=\mathrm{cov}(X,Z)+\mathrm{cov}(Y,Z)
  • D(X+Y)=D(X)+D(Y)+2cov(X,Y)D(X+Y)=D(X)+D(Y)+2\mathrm{cov}(X,Y)

相关系数

二维随机变量(X,Y)(X,Y), D(X)0D(X)\neq0D(Y)0D(Y)\neq0

ρXY=cov(X,Y)D(X)D(Y)\rho_{XY}=\dfrac{\mathrm{cov}(X,Y)}{\sqrt{D(X)}\cdot\sqrt{D(Y)}}

ρ1|\rho|\leqslant1

线性相关系数 ρ=1    P(Y=aX+b)=1,a0|\rho|=1\iff P(Y=aX+b)=1, a\neq0

极限定理

概率收敛Y1,Y2,,Yn,Y_1,Y_2,\cdots,Y_n,\cdots是随机变量序列且对常数aa, ε>0\forall \varepsilon>0

limnP(Ynaε)=0orlimnP(Yna<ε)=1\lim\limits_{n\to \infty}P(|Y_n-a|\geqslant\varepsilon)=0 \\ \text{or} \\ \lim\limits_{n\to \infty}P(|Y_n-a|<\varepsilon)=1

则随机序列概率收敛到常数aa, 记作

YnPaY_n\xrightarrow P a

大数定律

贝努利大数定律X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots是相互独立的随机变量序列且均服从以pp为参数的**(0-1)分布**, 则

1nk=1nXkPp\dfrac{1}{n}\sum_{k=1}^nX_k\xrightarrow{P}p

切比雪夫大数定律特例X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots是相互独立的随机变量序列且数学期望与方差相同, E(Xk)=μE(X_k)=\mu, D(Xk)=σ2D(X_k)=\sigma^2 (k=1,2,)(k=1,2,\cdots), 则

1nk=1nXkPμ\dfrac{1}{n}\sum_{k=1}^nX_k\xrightarrow{P}\mu

辛钦大数定律X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots是相互独立的随机变量序列且服从相同的分布, 并且存在数学期望E(Xk)=μE(X_k)=\mu, 则

1nk=1nXkPμ\dfrac{1}{n}\sum_{k=1}^nX_k\xrightarrow{P}\mu

中心极限定理


数理统计

数理统计相比于概率论, 研究的都是分布未知的随机变量

基本概念

总体 研究对象某个指标值得全体称为总体

个体 总体中的每个元素

抽样 按一定规则从总体中抽取若干个体的过程

样本 所抽取的个体

样本容量 样本中所包含的个体数

样本应该具有随机性, 独立性

常见统计量

统计量 样本的函数

样本均值 Xˉ\bar X

Xˉ=1ni=1nXi\bar X=\dfrac{1}{n}\sum_{i=1}^nX_i

偏差 样本中数据与样本均值的差XiXˉX_i-\bar X

性质 偏差和为0 (XiXˉ)=0\sum (X_i-\bar X)=0

样本均值的抽样分布 若总体分布为N(μ,σ2)N(\mu,\sigma^2), 则XˉN(μ,σ2n)\bar X\sim N(\mu,\dfrac{\sigma^2}{n}); 若总体不为正态分布但期望为μ\mu,方差为σ2\sigma^2Xˉ\bar X近似分布$ N(\mu,\dfrac{\sigma^2}{n})$

样本方差 S2S^2

S2=1n1i=1n(XiXˉ)2S^2=\dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2

样本标准差 S=S2S=\sqrt {S^2}

四大统计量及其分布

卡方分布/χ2\chi^2分布 对来自正态总体N(0,1)N(0,1)的样本X1,X2,,XnX_1, X_2,\cdots,X_n, 统计量χ2=i=1nXi2\chi^2=\sum^n_{i=1} X_i^2服从自由度为nn的卡方分布, 记作

χ2χ2(n)\chi^2\sim\chi^2(n)

E(χ2)=nE(\chi^2)=n

D(χ2)=2nD(\chi^2)=2n

n>45n>45时分位点近似公式χα2(n)n+2nzα\chi^2_\alpha(n)\approx n+\sqrt{2n}\cdot z_\alpha, zαz_\alpha为标准正态分布的分位点,

P(χ2>χα2(n))=χα2(n)+f(x)dxP(\chi^2>\chi^2_\alpha (n))=\int^{+\infty}_{\chi^2_\alpha(n)}f(x)\mathrm d x

tt分布/学生分布 XN(0,1)X\sim N(0,1), Yχ2(n)Y\sim\chi^2(n), X,YX,Y独立, t=XYnt=\dfrac{X}{\sqrt\frac{Y}{n}}

tt(n)t\sim t(n)

  • n=1n=1 均值不存在

  • n>1n>1 E(t)=0E(t)=0

  • n>2n>2 D(t)=nn2D(t)=\dfrac{n}{n-2}

分位点

P(t>tα(n))=tα(n)+h(t)dtP(t>t_\alpha(n))=\int_{t_{\alpha(n)}}^{+\infty}h(t)\mathrm dt

  • n>45n>45时, tα(n)zαt_\alpha(n)\approx z_\alpha

  • n45n\leqslant45时, 查表

FF分布 X ~ F(n1, n2)

正态总体相关四定理 对于来自正态总体XN(μ,σ2)X\sim N(\mu,\sigma^2)的样本X1,X2,,XnX_1,X_2,\cdots,X_n, 有

XˉN(μ,σ2n) or Xˉμσ/nN(0,1)XˉμS/nt(n1)(n1)S2σ2=i=1n(XiXˉ)2σ2χ2(n1)XˉS2相互独立\bar X\sim N(\mu,\dfrac{\sigma^2}{n})\ \text{or}\ \dfrac{\bar {X}-\mu}{\sigma/\sqrt n}\sim N(0,1) \\ \\ \dfrac{\bar {X}-\mu}{S/\sqrt n}\sim t(n-1) \\ \\ \dfrac{(n-1)S^2}{\sigma^2}=\dfrac{\sum_{i=1}^{n}(X_i-\bar X)^2}{\sigma^2} \sim \chi^2(n-1) \\ \\ \bar X\text{与}S^2\text{相互独立}

参数估计

矩估计

步骤kk个待估参数

  1. 求前kk阶矩,

  2. 用样本矩带入μi\mu_i

    Mi=1nj=1nXji=μiM_i=\dfrac{1}{n}\sum_{j=1}^{n}X_j^i=\mu_i

  3. 解方程

极大似然估计

步骤 求极大似然函数的最大值

  1. 写出极大似然函数
  2. 利用偏导或lnFlnF的偏导求最值

点估计优良性

无偏性 E(θ^)=θE(\hat\theta)=\theta

有效性θ^1,θ^2\hat\theta_1, \hat\theta_2都是无偏估计, 若D(θ^1θ)<D(θ^2θ)D(\hat\theta_1-\theta)<D(\hat\theta_2-\theta)θ^1\hat\theta_1更比2有效

相合性nn\to\infty, ε>0\forall\varepsilon>0

limnP(θ^nθ<ε)=1\lim\limits_{n\to\infty}P(|\hat\theta_n-\theta|<\varepsilon)=1

区间估计

P(θ<θ<θ)=1αP(\underline\theta<\theta<\overline\theta)=1-\alpha

置信区间 (θ,θ)(\underline\theta,\overline\theta)

置信上限 θ\overline\theta

置信下限 θ\underline\theta

置信度/置信概率 1α1-\alpha

正态总体均值

单个正态总体 μ\mu

  • σ2\sigma^2已知

    (X±σnzα2)(\overline X\pm\dfrac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}} )

  • σ2\sigma^2未知

    (X±Sntα2(n1))(\overline X\pm\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) )

两个正态总体 μ1μ2\mu_1-\mu_2

  • σ12\sigma^2_1,σ22,\sigma_2^2均已知

    (XˉYˉ±σ12n1+σ22n2zα2)(\bar X-\bar Y\pm\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}\cdot z_{\frac{\alpha}{2}})

  • σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2但未知

    (XˉYˉ±Sw1n1+1n2tα2(n1+n22))(\bar X-\bar Y\pm S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\cdot t_{\frac{\alpha}{2}}(n_1+n_2-2))

正态总体方差

单个正态总体

((n1)S2χα22(n1),(n1)S2χ1α22(n1))\bigg(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\bigg)

(0-1)分布总体方差

(n+zα22)p2(2nXˉ+zα22)p+nXˉ2=0(n+z^2_{\frac{\alpha}{2}})p^2-(2n\bar X+z^2_{\frac{\alpha}{2}})p+n\bar X^2=0

解方程得到

(p1,p2)(p_1,p_2)

假设检验

一般步骤

  1. 提出原假设H0H_0及备择假设H1H_1
  2. 给定显著性水平α\alpha及样本容量nn
  3. 提出拒绝域的形式并确定检验统计量
  4. P(拒绝H0  H0为真)=αP(\text{拒绝}H_0\ |\ H_0\text{为真})=\alpha求表达式
  5. 对总体抽样判断是否接受假设

单个正态总体的假设检验

μ\mu的假设检验 H0:μ=μ0H_0:\mu=\mu_0的拒绝域

  • σ2\sigma^2已知

    Xˉμ0σ/n>zα2|\dfrac{\bar X-\mu_0}{\sigma/\sqrt n}|>z_{\frac{\alpha}{2}}

  • σ2\sigma^2未知

    t=Xˉμ0S/n>tα2(n1)|t|=|\dfrac{\bar X-\mu_0}{S/\sqrt n}|>t_{\frac{\alpha}{2}}(n-1)

σ2\sigma^2的假设检验 H0:σ2=σ02H_0:\sigma^2=\sigma^2_0的拒绝域

χ2=(n1)S2σ02(0,χ1α22(n1))(χα22(n1),+)\chi^2=\dfrac{(n-1)S^2}{\sigma^2_0}\in(0,\chi_{1-\frac{\alpha}{2}}^2(n-1))\cup(\chi_{\frac{\alpha}{2}}^2(n-1),+\infty)

单边假设检验 H0:μμ0H_0:\mu\geqslant\mu_0的拒绝域

xˉμ0<σ0nzα\bar x-\mu_0<-\dfrac{\sigma_0}{\sqrt{n}}\cdot z_\alpha

两个正态总体的假设检验

方差已知均值的假设检验 H0:μ1=μ2H_0:\mu_1=\mu_2

U=xˉyˉσ12n1σ22n2>zα2|U|=|\dfrac{\bar x-\bar y}{\sqrt{\dfrac{\sigma_1^2}{n_1}-\dfrac{\sigma_2^2}{n_2}}}|>z_{\frac{\alpha}{2}}

均值未知总体方差的检验 H0:σ12=σ22H_0:\sigma^2_1=\sigma^2_2的拒绝域

S12S22(0,F1α2(n11,n21))(Fα2(n11,n21),+)\dfrac{S_1^2}{S_2^2}\in (0,F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1))\cup (F_{\frac{\alpha}{2}}(n_1-1,n_2-1),+\infty)

分布拟合检验

n50n\geqslant50时(充分大时),

δ\delta