概率论知识点合集2

大学计算机专业概率论与数理统计知识点

五、简单随机样本及抽样分布

  1. 顺序统计量:将随机变量取值从小到大排,$X_{(1)}$ 最小
  2. 样本变异系数:$C_r = \frac{s}{\bar{x}}$
  3. $\mu = E(\bar{x})$,$\bar{x}$ 是 n 个样本算出的均值
  4. $\sigma^2 = nD(\bar{x})$
  5. 中心极限定理:当 $n \to \infty$ 时,$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$(这里面的参数是新的统计量,比如平均值,的估计量)
  6. 上 $\alpha$ 分位点(标准正态) alt text
  7. $\chi^2$ 分布
    • a. 定义:若 $X_1, X_2, \dots, X_n \stackrel{i.i.d}{\sim} N(0, 1) \Rightarrow \chi_n^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)$
    • b. $f(x) = \begin{cases} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1} e^{-\frac{x}{2}}, & x > 0 \ 0, & x \le 0 \end{cases}$,其中 $\Gamma(x) = \int_0^{+\infty} t^{x-1} e^{-t} dt$,有 $\Gamma(a+1) = a\Gamma(a) \Rightarrow \Gamma(n+1) = n!$
    • c. $E(\chi^2(n)) = n$
    • d. $D(\chi^2(n)) = 2n$
    • e. 对独立的 $\chi^2$,有 $\chi^2(m) + \chi^2(n) \sim \chi^2(m+n)$
    • f. 当 $n > 45$ 时,$\chi^2_\alpha(n) \approx \frac{1}{2} (z_\alpha + \sqrt{2n-1})^2$
  8. t 分布
    • a. 定义:若 $X \sim N(0, 1)$,$Y \sim \chi^2(n)$,且 $X$ 与 $Y$ 相互独立,则 $\frac{X}{\sqrt{Y/n}} \sim t(n)$ alt text
    • b. $f(x)$ 为偶函数
    • c. $\lim_{n \to \infty} f_{t(n)}(x) = \varphi(x)$
    • d. $E[t(n)] = 0$
    • e. $D[t(n)] = \frac{n}{n-2}$ $(n \ge 3)$
    • f. $t_{1-\alpha}(n) = -t_\alpha(n)$
    • g. 当 $n > 45$ 时,$t(n) \approx z_\alpha$
  9. F 分布
    • a. 定义:当 $X \sim \chi^2(m)$,$Y \sim \chi^2(n)$,则 $F = \frac{X/m}{Y/n} \sim F(m, n)$
    • b. $E[F(m, n)] = \frac{n}{n-2}$ $(n > 2)$
    • c. $D[F(m, n)] = \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}$ $(n > 4)$
    • d. $F_{1-\alpha}(m, n) = \frac{1}{F_\alpha(n, m)}$
  10. 单个正态总体的抽样分布
    • 若 $x_1, \cdots, x_n \stackrel{i.i.d}{\sim} N(\mu, \sigma^2)$
    • 令 $\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i$,$S^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2$
    • a. $\bar{x} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$
    • b. $\sum_{i=1}^n \left(\frac{x_i - \mu}{\sigma}\right)^2 \sim \chi^2(n)$
    • c. $\bar{x}$ 与 $S^2$ 独立
    • d. $\frac{\bar{x} - \mu}{S/\sqrt{n}} \sim t(n-1)$
    • e. $\sum_{i=1}^{n} \left(\frac{x_i - \bar{x}}{\sigma}\right)^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$

六、点估计

  1. 矩估计 (MOM)
    • a. 用样本均值/方差估计总体均值/方差
    • b. $\hat{\mu} = \bar{x}$
    • c. $\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 - \bar{x}^2$
  2. 最大似然估计 (MLE)
    • a. 想办法让出现该样本组合的概率最大
    • b. 设总体分布与参数 $\theta$ 有关,样本 $X_1, X_2, \cdots, X_n$ 的观测值为 $x_1, x_2, \cdots, x_n$
    • c. 离散型总体时,$L(\theta) = \prod_{i=1}^{n} P{X=x_i; \theta}$;连续型总体时,$L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)$
    • d. 令 $L(\theta)$ 取得最大值,对应的参数估计记为 $\hat{\theta}$
  3. 均方误差 (MSE) $\text{MSE}(\hat{\theta}) = E[(\hat{\theta} - \theta)^2] = D(\hat{\theta}) + (E(\hat{\theta}) - \theta)^2$
  4. 偏差 $b_n = E(\hat{\theta}) - \theta$
  5. 无偏性:无系统偏差,$b_n = 0$
  6. 有效性:$D(\hat{\theta})$ 越小越好
  7. 相合性(一致性):样本越多,估计越准确;对任意 $\epsilon > 0$,都有 $\lim_{n \to \infty} P{|\hat{\theta} - \theta| < \epsilon} = 1$

七、区间估计

  1. Neyman 原理:给定置信水平 $1-\alpha$,在满足覆盖概率要求的前提下,让置信区间尽可能短
  2. 单个正态总体参数的区间估计
    • a. $\sigma^2$ 已知,$\mu$ 的置信区间 $[\bar{x} - z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}, \bar{x} + z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}]$
    • b. $\sigma^2$ 未知,$\mu$ 的置信区间 $[\bar{x} - t_{\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}, \bar{x} + t_{\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}]$
    • c. $\sigma^2$ 的置信区间 $[\frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}, \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}]$

八、假设检验

  1. 基本思想:根据样本构造检验统计量,判断是否有足够证据拒绝原假设
  2. 正常方法
    • a. 建立假设 $H_0$
    • b. 构造检验统计量 $T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1)$(检验均值) $\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \sim \chi^2(n-1)$(检验方差)
    • c. 查 t 的表得拒绝域
    • d. 代入待检验的值,看是否在拒绝域内
本文采用 CC BY 4.0 许可协议,转载请注明出处。
使用 Hugo 构建
主题 StackJimmy 设计