2.3 从某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值overline(y)与样本方差s²;2)若用overline(y)估计总体均值μ,按数理统计结果,overline(y)是否无偏?写出它的方差表达式;3)根据上述样本数据,如何估计overline(y)的方差?4)给出总体均值μ的置信度分别为90%,95%与99%的近似置信区间。
题目解答
答案
为了解决这个问题,我们将按照以下步骤进行:
- 计算样本均值$\overline{y}$与样本方差$s^2$。
- 确定$\overline{y}$作为总体均值$\mu$的估计是否无偏,并写出其方差表达式。
- 根据样本数据估计$\overline{y}$的方差。
- 给出总体均值$\mu$的置信度分别为90%,95%与99%的近似置信区间。
第1步:计算样本均值$\overline{y}$与样本方差$s^2$
首先,我们计算样本均值$\overline{y}$:
$\overline{y} = \frac{1}{n} \sum_{i=1}^n y_i$
其中$n = 50$,$y_i$是样本数据点。将所有数据点相加,我们得到:
$\sum_{i=1}^n y_i = 567 + 601 + 665 + \cdots + 476 = 20450$
因此,样本均值为:
$\overline{y} = \frac{20450}{50} = 409$
接下来,我们计算样本方差$s^2$:
$s^2 = \frac{1}{n-1} \sum_{i=1}^n (y_i - \overline{y})^2$
首先,我们计算$(y_i - \overline{y})^2$对于每个数据点,然后将它们相加:
$\sum_{i=1}^n (y_i - \overline{y})^2 = (567 - 409)^2 + (601 - 409)^2 + \cdots + (476 - 409)^2 = 1139914$
因此,样本方差为:
$s^2 = \frac{1139914}{49} \approx 23263.551$
第2步:确定$\overline{y}$作为总体均值$\mu$的估计是否无偏,并写出其方差表达式
样本均值$\overline{y}$是总体均值$\mu$的无偏估计量。其方差表达式为:
$\text{Var}(\overline{y}) = \frac{\sigma^2}{n}$
其中$\sigma^2$是总体方差,$n$是样本大小。由于$\sigma^2$未知,我们用样本方差$s^2$来估计它:
$\text{Var}(\overline{y}) \approx \frac{s^2}{n} = \frac{23263.551}{50} \approx 465.271$
第3步:根据样本数据估计$\overline{y}$的方差
如上所述,$\overline{y}$的方差的估计值为:
$\text{Var}(\overline{y}) \approx 465.271$
第4步:给出总体均值$\mu$的置信度分别为90%,95%与99%的近似置信区间
总体均值$\mu$的置信区间由下式给出:
$\overline{y} \pm t_{\alpha/2, n-1} \sqrt{\frac{s^2}{n}}$
其中$t_{\alpha/2, n-1}$是自由度为$n-1$的t分布的上$\alpha/2$分位数。
对于90%的置信区间,$\alpha = 0.10$,$\alpha/2 = 0.05$,且$t_{0.05, 49} \approx 1.677$:
$409 \pm 1.677 \sqrt{465.271} \approx 409 \pm 1.677 \times 21.570 \approx 409 \pm 36.096$
因此,90%的置信区间为:
$(372.904, 445.096)$
对于95%的置信区间,$\alpha = 0.05$,$\alpha/2 = 0.025$,且$t_{0.025, 49} \approx 2.010$:
$409 \pm 2.010 \sqrt{465.271} \approx 409 \pm 2.010 \times 21.570 \approx 409 \pm 43.356$
因此,95%的置信区间为:
$(365.644, 452.356)$
对于99%的置信区间,$\alpha = 0.01$,$\alpha/2 = 0.005$,且$t_{0.005, 49} \approx 2.680$:
$409 \pm 2.680 \sqrt{465.271} \approx 409 \pm 2.680 \times 21.570 \approx 409 \pm 57.816$
因此,99%的置信区间为:
$(351.184, 466.816)$
最终答案为:
$\boxed{(372.904, 445.096), (365.644, 452.356), (351.184, 466.816)}$