题目
下表分别给出两位文学家马克·吐温(Mark Twain)的8篇小品文以及-|||-斯诺特格拉斯(Snodgrass)的10篇小品文中由3个字母组成的单词的比例:-|||-马克·吐温 0.225 0.262 0.217 0.2400.0.229 0.235 0.217-|||-斯诺特格拉斯 0.2090.2050.1960.2100.2020.207 0.224 0.223 0.220 0.201-|||-设两组数据分别来自正态总体,且两总体方差相等,但参数均未知.两样本-|||-相互独立.问两位作家所写的小品文中包含由3个字母组成的单词的比例是否-|||-有显著的差异(取 alpha =0.05 ?

题目解答
答案

解析
考查要点:本题主要考查独立样本t检验的应用,用于判断两个正态总体均值是否存在显著差异,假设方差未知但相等。
解题核心思路:
- 确定假设:原假设$H_0: \mu_1 = \mu_2$,备择假设$H_1: \mu_1 \neq \mu_2$。
- 检验统计量:采用t检验统计量,公式为:
$t = \frac{\overline{X} - \overline{Y}}{S_v \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$
其中$S_v$为合并方差。 - 合并方差计算:通过两组样本方差加权平均得到:
$S_v^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$ - 拒绝域判断:根据自由度$n_1 + n_2 - 2$和显著性水平$\alpha=0.05$,查t分布表确定临界值,比较统计量绝对值与临界值。
破题关键:
- 正确代入公式,注意合并方差的计算和t统计量的分母形式。
- 自由度计算为两样本容量之和减2。
1. 数据整理与假设
- 样本容量:$n_1 = 8$(马克·吐温),$n_2 = 10$(斯诺特格拉斯)。
- 样本均值:$\overline{X} = 0.2319$,$\overline{Y} = 0.2097$。
- 样本方差:$S_1^2 = (0.0146)^2$,$S_2^2 = (0.0097)^2$。
2. 合并方差计算
$S_v^2 = \frac{(8-1)(0.0146)^2 + (10-1)(0.0097)^2}{8 + 10 - 2} = \frac{7 \cdot 0.000213 + 9 \cdot 0.000094}{16} \approx 0.000146$
$S_v = \sqrt{0.000146} \approx 0.0121$
3. t检验统计量计算
$t = \frac{0.2319 - 0.2097}{0.0121 \cdot \sqrt{\frac{1}{8} + \frac{1}{10}}} = \frac{0.0222}{0.0121 \cdot 0.4743} \approx \frac{0.0222}{0.00573} \approx 3.875$
4. 临界值与决策
- 自由度:$df = 8 + 10 - 2 = 16$。
- 临界值:$t_{0.025}(16) = 2.1199$。
- 比较:$|t| \approx 3.875 > 2.1199$,落入拒绝域,拒绝原假设。