概率论知识点合集2

五、简单随机样本及抽样分布

顺序统计量：将随机变量取值从小到大排，$X_{(1)}$ 最小
样本变异系数：$C_r = \frac{s}{\bar{x}}$
$\mu = E(\bar{x})$，$\bar{x}$ 是 n 个样本算出的均值
$\sigma^2 = nD(\bar{x})$
中心极限定理：当 $n \to \infty$ 时，$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$（这里面的参数是新的统计量，比如平均值，的估计量）
上 $\alpha$ 分位点（标准正态）
$\chi^2$ 分布
- a. 定义：若 $X_1, X_2, \dots, X_n \stackrel{i.i.d}{\sim} N(0, 1) \Rightarrow \chi_n^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)$
- b. $f(x) = \begin{cases} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1} e^{-\frac{x}{2}}, & x > 0 \ 0, & x \le 0 \end{cases}$，其中 $\Gamma(x) = \int_0^{+\infty} t^{x-1} e^{-t} dt$，有 $\Gamma(a+1) = a\Gamma(a) \Rightarrow \Gamma(n+1) = n!$
- c. $E(\chi^2(n)) = n$
- d. $D(\chi^2(n)) = 2n$
- e. 对独立的 $\chi^2$，有 $\chi^2(m) + \chi^2(n) \sim \chi^2(m+n)$
- f. 当 $n > 45$ 时，$\chi^2_\alpha(n) \approx \frac{1}{2} (z_\alpha + \sqrt{2n-1})^2$
t 分布
- a. 定义：若 $X \sim N(0, 1)$，$Y \sim \chi^2(n)$，且 $X$ 与 $Y$ 相互独立，则 $\frac{X}{\sqrt{Y/n}} \sim t(n)$
- b. $f(x)$ 为偶函数
- c. $\lim_{n \to \infty} f_{t(n)}(x) = \varphi(x)$
- d. $E[t(n)] = 0$
- e. $D[t(n)] = \frac{n}{n-2}$ $(n \ge 3)$
- f. $t_{1-\alpha}(n) = -t_\alpha(n)$
- g. 当 $n > 45$ 时，$t(n) \approx z_\alpha$
F 分布
- a. 定义：当 $X \sim \chi^2(m)$，$Y \sim \chi^2(n)$，则 $F = \frac{X/m}{Y/n} \sim F(m, n)$
- b. $E[F(m, n)] = \frac{n}{n-2}$ $(n > 2)$
- c. $D[F(m, n)] = \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}$ $(n > 4)$
- d. $F_{1-\alpha}(m, n) = \frac{1}{F_\alpha(n, m)}$
单个正态总体的抽样分布
- 若 $x_1, \cdots, x_n \stackrel{i.i.d}{\sim} N(\mu, \sigma^2)$
- 令 $\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i$，$S^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2$
- a. $\bar{x} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$
- b. $\sum_{i=1}^n \left(\frac{x_i - \mu}{\sigma}\right)^2 \sim \chi^2(n)$
- c. $\bar{x}$ 与 $S^2$ 独立
- d. $\frac{\bar{x} - \mu}{S/\sqrt{n}} \sim t(n-1)$
- e. $\sum_{i=1}^{n} \left(\frac{x_i - \bar{x}}{\sigma}\right)^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$

六、点估计

矩估计 (MOM)
- a. 用样本均值/方差估计总体均值/方差
- b. $\hat{\mu} = \bar{x}$
- c. $\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 - \bar{x}^2$
最大似然估计 (MLE)
- a. 想办法让出现该样本组合的概率最大
- b. 设总体分布与参数 $\theta$ 有关，样本 $X_1, X_2, \cdots, X_n$ 的观测值为 $x_1, x_2, \cdots, x_n$
- c. 离散型总体时，$L(\theta) = \prod_{i=1}^{n} P{X=x_i; \theta}$；连续型总体时，$L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)$
- d. 令 $L(\theta)$ 取得最大值，对应的参数估计记为 $\hat{\theta}$
均方误差 (MSE) $\text{MSE}(\hat{\theta}) = E[(\hat{\theta} - \theta)^2] = D(\hat{\theta}) + (E(\hat{\theta}) - \theta)^2$
偏差 $b_n = E(\hat{\theta}) - \theta$
无偏性：无系统偏差，$b_n = 0$
有效性：$D(\hat{\theta})$ 越小越好
相合性（一致性）：样本越多，估计越准确；对任意 $\epsilon > 0$，都有 $\lim_{n \to \infty} P{|\hat{\theta} - \theta| < \epsilon} = 1$

七、区间估计

Neyman 原理：给定置信水平 $1-\alpha$，在满足覆盖概率要求的前提下，让置信区间尽可能短
单个正态总体参数的区间估计
- a. $\sigma^2$ 已知，$\mu$ 的置信区间 $[\bar{x} - z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}, \bar{x} + z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}]$
- b. $\sigma^2$ 未知，$\mu$ 的置信区间 $[\bar{x} - t_{\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}, \bar{x} + t_{\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}]$
- c. $\sigma^2$ 的置信区间 $[\frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}, \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}]$

八、假设检验

基本思想：根据样本构造检验统计量，判断是否有足够证据拒绝原假设
正常方法：
- a. 建立假设 $H_0$
- b. 构造检验统计量 $T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1)$（检验均值） $\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \sim \chi^2(n-1)$（检验方差）
- c. 查 t 的表得拒绝域
- d. 代入待检验的值，看是否在拒绝域内