题目
5.下表分别给出两个文学家马克·吐温(Mark Twain)的8篇-|||-小品文以及斯诺特格拉斯(Snodgrass)的10篇小品文中由3个字-|||-母组成的单字的比例.-|||-马克·吐温 0.225 0.262 0.2170.240 0.230 0.229 0.235 0-|||-斯诺特格拉斯 0.209 0.205 0.196 0.2100.2020.207 0.2240.2230.220 0.201-|||-设两组数据分别来自正态总体,且两总体方差相等,但参数均未-|||-知.两样本相互独立.问两个作家所写的小品文中包含由3个字母-|||-组成的单字的比例是否有显著的差异(取 alpha =0.05 ?

题目解答
答案

解析
步骤 1:定义总体和样本
- 设马克·吐温的小品文中的3个字母组成的单字比例来自正态总体 $X \sim N(\mu_1, \sigma^2)$
- 设斯诺特格拉斯的小品文中的3个字母组成的单字比例来自正态总体 $Y \sim N(\mu_2, \sigma^2)$
- 两总体方差相等,但均未知
- 两样本相互独立
- 样本数据如下:
- 马克·吐温的小品文:0.225, 0.262, 0.217, 0.240, 0.230, 0.229, 0.235, 0.231
- 斯诺特格拉斯的小品文:0.209, 0.205, 0.219, 0.210, 0.202, 0.207, 0.224, 0.223, 0.220, 0.201
步骤 2:计算样本均值和样本方差
- 马克·吐温的小品文样本均值 $\overline{x} = \frac{1}{8} \sum_{i=1}^{8} x_i = 0.2319$
- 斯诺特格拉斯的小品文样本均值 $\overline{y} = \frac{1}{10} \sum_{i=1}^{10} y_i = 0.2097$
- 马克·吐温的小品文样本方差 $s_1^2 = \frac{1}{7} \sum_{i=1}^{8} (x_i - \overline{x})^2 = 0.000213$
- 斯诺特格拉斯的小品文样本方差 $s_2^2 = \frac{1}{9} \sum_{i=1}^{10} (y_i - \overline{y})^2 = 0.000114$
步骤 3:计算合并方差
- 合并方差 $s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} = \frac{7 \times 0.000213 + 9 \times 0.000114}{8 + 10 - 2} = 0.000163$
步骤 4:计算t统计量
- t统计量 $t = \frac{\overline{x} - \overline{y}}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} = \frac{0.2319 - 0.2097}{\sqrt{0.000163} \sqrt{\frac{1}{8} + \frac{1}{10}}} = 3.900$
步骤 5:确定临界值和拒绝域
- 自由度 $df = n_1 + n_2 - 2 = 8 + 10 - 2 = 16$
- 临界值 $t_{0.025}(16) = 2.1199$
- 拒绝域为 $|t| \geq t_{0.025}(16) = 2.1199$
步骤 6:判断是否拒绝原假设
- 观察值 $|t| = 3.900 > 2.1199$,落在拒绝域内
- 因此,拒绝原假设 $H_0: \mu_1 = \mu_2$,认为两个作家所写的小品文中包含由3个字母组成的单字的比例有显著的差异
- 设马克·吐温的小品文中的3个字母组成的单字比例来自正态总体 $X \sim N(\mu_1, \sigma^2)$
- 设斯诺特格拉斯的小品文中的3个字母组成的单字比例来自正态总体 $Y \sim N(\mu_2, \sigma^2)$
- 两总体方差相等,但均未知
- 两样本相互独立
- 样本数据如下:
- 马克·吐温的小品文:0.225, 0.262, 0.217, 0.240, 0.230, 0.229, 0.235, 0.231
- 斯诺特格拉斯的小品文:0.209, 0.205, 0.219, 0.210, 0.202, 0.207, 0.224, 0.223, 0.220, 0.201
步骤 2:计算样本均值和样本方差
- 马克·吐温的小品文样本均值 $\overline{x} = \frac{1}{8} \sum_{i=1}^{8} x_i = 0.2319$
- 斯诺特格拉斯的小品文样本均值 $\overline{y} = \frac{1}{10} \sum_{i=1}^{10} y_i = 0.2097$
- 马克·吐温的小品文样本方差 $s_1^2 = \frac{1}{7} \sum_{i=1}^{8} (x_i - \overline{x})^2 = 0.000213$
- 斯诺特格拉斯的小品文样本方差 $s_2^2 = \frac{1}{9} \sum_{i=1}^{10} (y_i - \overline{y})^2 = 0.000114$
步骤 3:计算合并方差
- 合并方差 $s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} = \frac{7 \times 0.000213 + 9 \times 0.000114}{8 + 10 - 2} = 0.000163$
步骤 4:计算t统计量
- t统计量 $t = \frac{\overline{x} - \overline{y}}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} = \frac{0.2319 - 0.2097}{\sqrt{0.000163} \sqrt{\frac{1}{8} + \frac{1}{10}}} = 3.900$
步骤 5:确定临界值和拒绝域
- 自由度 $df = n_1 + n_2 - 2 = 8 + 10 - 2 = 16$
- 临界值 $t_{0.025}(16) = 2.1199$
- 拒绝域为 $|t| \geq t_{0.025}(16) = 2.1199$
步骤 6:判断是否拒绝原假设
- 观察值 $|t| = 3.900 > 2.1199$,落在拒绝域内
- 因此,拒绝原假设 $H_0: \mu_1 = \mu_2$,认为两个作家所写的小品文中包含由3个字母组成的单字的比例有显著的差异