某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成,采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1) 求总体中赞成该项改革的户数比率的置信区间,置信水平为95%。(2) 如果小区管理者预计赞成的比率能达到80%,要求估计误差不超过10%,应抽取多少户进行调查?
某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成,采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1) 求总体中赞成该项改革的户数比率的置信区间,置信水平为95%。 (2) 如果小区管理者预计赞成的比率能达到80%,要求估计误差不超过10%,应抽取多少户进行调查?
题目解答
答案
我们来逐步解答这道统计学题目,题目分为两部分,涉及置信区间的计算和样本量的确定。
题目背景回顾:
- 总体户数:500户(但抽样是重复抽样,因此总体大小对计算影响不大)
- 抽样方式:重复抽样,随机抽取50户
- 赞成户数:32户
- 反对户数:18户
- 样本量 $ n = 50 $
- 赞成比率样本估计值:$ \hat{p} = \frac{32}{50} = 0.64 $
第(1)问:求总体中赞成比率的95%置信区间
解题步骤:
我们要估计的是总体中赞成比率 $ p $ 的95%置信区间。
由于是重复抽样,且样本量 $ n = 50 $,虽然不算很大,但可以使用正态近似法(当 $ np \geq 5 $ 且 $ n(1-p) \geq 5 $ 时适用)。
先验证:
- $ n\hat{p} = 50 \times 0.64 = 32 \geq 5 $
- $ n(1 - \hat{p}) = 50 \times 0.36 = 18 \geq 5 $
满足条件,可以使用正态近似。
置信区间公式:
$\hat{p} \pm z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}$
其中:
- $ \hat{p} = 0.64 $
- $ n = 50 $
- 置信水平为95%,对应的 $ z_{\alpha/2} = 1.96 $(标准正态分布的分位数)
计算标准误(SE):
$SE = \sqrt{\frac{0.64 \times (1 - 0.64)}{50}} = \sqrt{\frac{0.64 \times 0.36}{50}} = \sqrt{\frac{0.2304}{50}} = \sqrt{0.004608} \approx 0.06788$
计算边际误差(ME):
$ME = z \cdot SE = 1.96 \times 0.06788 \approx 0.1330$
计算置信区间:
$0.64 \pm 0.1330 \Rightarrow (0.507, 0.773)$
答案(1):
在95%的置信水平下,总体中赞成该项改革的户数比率的置信区间为:
$\boxed{(50.7\%,\ 77.3\%)}$
第(2)问:若预计赞成比率为80%,要求估计误差不超过10%,应抽取多少户?
解题目标:
确定在给定精度(估计误差不超过10%)和预计比率(80%)的情况下,所需的样本量。
注意:题目中“估计误差不超过10%”指的是绝对误差不超过10个百分点,即 $ E = 0.10 $。
置信水平仍然是95%,所以 $ z = 1.96 $
样本量计算公式(用于比率估计):
$n = \left( \frac{z^2 \cdot p(1 - p)}{E^2} \right)$
其中:
- $ z = 1.96 $
- $ p = 0.80 $(预计赞成率)
- $ E = 0.10 $(允许的误差)
代入计算:
$n = \frac{(1.96)^2 \cdot 0.80 \cdot (1 - 0.80)}{(0.10)^2} = \frac{3.8416 \cdot 0.80 \cdot 0.20}{0.01}$
先算分子:
$3.8416 \times 0.16 = 0.614656$
再除以0.01:
$n = \frac{0.614656}{0.01} = 61.4656$
向上取整(因为样本量必须为整数,且要保证精度):
$n = 62$
注意:
题目中提到“重复抽样”,因此不需要进行有限总体校正(Finite Population Correction),即使总体是500户。
答案(2):
应抽取至少 $ \boxed{62} $ 户进行调查。
最终答案总结:
(1) 95%置信区间为:$ \boxed{(50.7\%,\ 77.3\%)} $
(2) 应抽取的样本量为:$ \boxed{62} $ 户
解析
本题主要考查总体比率的置信区间计算以及样本量的确定。解题思路如下:
第(1)问
- 首先明确已知条件,总体户数为500户,采用重复抽样随机抽取50户,其中赞成户数为32户,由此可计算出样本中赞成的比率$\hat{p}$。
- 接着验证是否满足使用正态近似法计算置信区间的条件,即$n\hat{p} \geq 5$且$n(1 - \hat{p}) \geq 5$。
- 若满足条件,使用总体比率置信区间公式$\hat{p} \pm z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}$进行计算,其中$\hat{p}$为样本比率,$n$为样本量,$z_{\alpha/2}$为对应置信水平下的标准正态分布分位数。
- 先计算标准误$SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}$,再计算边际误差$ME = z_{\alpha/2} \cdot SE$,最后得出置信区间。
第(2)问
- 明确已知条件,预计赞成比率$p = 0.80$,允许的估计误差$E = 0.10$,置信水平为95%,对应的$z = 1.96$。
- 使用样本量计算公式$n = \left( \frac{z^2 \cdot p(1 - p)}{E^2} \right)$计算所需样本量。
- 由于样本量必须为整数,且要保证精度,所以对计算结果向上取整。
详细计算过程
第(1)问
- 计算样本中赞成的比率$\hat{p}$:
已知抽取$n = 50$户,其中赞成户数为32户,所以$\hat{p} = \frac{32}{50} = 0.64$。 - 验证使用正态近似法的条件:
$n\hat{p} = 50 \times 0.64 = 32 \geq 5$,$n(1 - \hat{p}) = 50 \times (1 - 0.64) = 50 \times 0.36 = 18 \geq 5$,满足条件。 - 确定$z_{\alpha/2}$的值:
置信水平为95%,则$\alpha = 1 - 0.95 = 0.05$,$\alpha/2 = 0.025$,查标准正态分布表可得$z_{\alpha/2} = 1.96$。 - 计算标准误$SE$:
$SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} = \sqrt{\frac{0.64 \times (1 - 0.64)}{50}} = \sqrt{\frac{0.64 \times 0.36}{50}} = \sqrt{\frac{0.2304}{50}} = \sqrt{0.004608} \approx 0.06788$。 - 计算边际误差$ME$:
$ME = z_{\alpha/2} \cdot SE = 1.96 \times 0.06788 \approx 0.1330$。 - 计算置信区间:
$\hat{p} \pm ME = 0.64 \pm 0.1330$,即$(0.64 - 0.1330, 0.64 + 0.1330) = (0.507, 0.773)$,转化为百分数形式为$(50.7\%, 77.3\%)$。
第(2)问
- 已知$z = 1.96$,$p = 0.80$,$E = 0.10$,代入样本量计算公式:
$n = \left( \frac{z^2 \cdot p(1 - p)}{E^2} \right) = \frac{(1.96)^2 \cdot 0.80 \cdot (1 - 0.80)}{(0.10)^2} = \frac{3.8416 \cdot 0.80 \cdot 0.20}{0.01}$。 - 先计算分子:
$3.8416 \times 0.80 \times 0.20 = 3.8416 \times 0.16 = 0.614656$。 - 计算样本量$n$:
$n = \frac{0.614656}{0.01} = 61.4656$。 - 向上取整:
因为样本量必须为整数,所以$n = 62$。