设X_1, X_2, ldots, X_n是来自总体N(mu, sigma^2)的样本,令Y = (sum_(i=1)^n(X_i - overline(X))^2)/(sigma^2),则Y sim ( )。A. chi^2(n)B. chi^2(n-1)C. N(mu, sigma^2)D. N(mu, sigma^2/n)
A. $\chi^2(n)$
B. $\chi^2(n-1)$
C. $N(\mu, \sigma^2)$
D. $N(\mu, \sigma^2/n)$
题目解答
答案
解析
本题考察卡方分布的定义及样本方差的性质,关键是将给定统计量$Y$与卡方分布的典型形式联系起来。
步骤1:回忆卡方分布的定义
若$Z_1,Z_2,\ldots,Z_m$是相互独立的标准正态分布随机变量(即$Z_i\sim N(0,1)$),则统计量
$\chi^2 = Z_1^2 + Z_2^2 + \cdots + Z_m^2$
服从自由度为$m$的卡方分布,记为$\chi^2(m)$。
步骤2:分析样本均值与样本偏差
设样本均值$\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i$,则每个$X_i - \overline{X}$是样本偏差。由于$X_i\sim N(\mu,\sigma^2)$,且$X_i$相互独立,故:
- $\overline{X}\sim N\left(\mu,\frac{\sigma^2}{n}\right)$(样本均值的分布);
- $X_i - \overline{X}$可表示为$X_i - \overline{X} = \left(X_i - \mu\right) - \left(\overline{X} - \mu\right)$,其方差为$\text{Var}(X_i - \overline{X}) = \sigma^2 - \frac{\sigma^2}{n} = \frac{n-1}{n}\sigma^2$(推导见下方)。
步骤3:标准化样本偏差
对$X_i - \overline{X}$标准化,得:
$\frac{X_i - \overline{X}}{\sqrt{\frac{n-1}{n}\sigma^2}} = \frac{X_i - \overline{X}}{S} \cdot \sqrt{n-1}\quad (S\text{为样本标准差})$
但更直接的是考虑统计量:
$\sum_{i=1}^n \left(\frac{X_i - \overline{X}}{\sigma}\right)^2 \sim \chi^2(n-1)$
这是因为:
- $\frac{X_i - \overline{X}}{\sigma}\sim N(0,\frac{n-1}{n})$(非标准正态),但通过正交变换可证明其平方和的自由度为$n-1$(样本均值约束了一个自由度)。
步骤4:对比题目中的$Y$
题目中$Y = \frac{\sum_{i=1}^n (X_i - \overline{X})^2}{\sigma^2}$,恰好是上述平方和,故$Y\sim \chi^2(n-1)$。