2020年初,新冠肺炎疫情袭击全国,某省由于人员流动性较大,成为湖北省外疫情最严重的省份之一,截至2月29日,该省己累计确诊1349例患者(无境外输入病例).为了解新冠肺炎的相关特征,研究人员从该省随机抽取100名确诊患者,统计他们的年龄数据,得下面的频数分布表: 年龄 [10,20] (20,30] (30,40] (40,50] (50,60] (60,70] (70,80] (80,90] (90,100] 人数 2 6 12 18 22 22 12 4 2 由频数分布表可以大致认为,该省新冠肺炎患者的年龄Z服从正态分布N(μ,15.22),其中μ近似为这100名患者年龄的样本平均数(同一组中的数据用该组区间的中点值作代表).请估计该省新冠肺炎患者年龄在70岁以上(⩾70)的患者比例.截至2月29日,该省新冠肺炎的密切接触者(均已接受检测)中确诊患者约占10%,以这些密切接触者确诊的频率代替1名密切接触者确诊发生的概率,每名密切接触者是否确诊相互独立.现有密切接触者20人,为检测出所有患者,设计了如下方案:将这20名密切接触者随机地按n(1<n<20且n是20的约数)个人一组平均分组,并将同组的n个人每人抽取的一半血液混合在一起化验,若发现新冠病毒,则对该组的n个人抽取的另一半血液逐一化验,记n个人中患者的人数为Xn,以化验次数的期望值为决策依据,试确定使得20人的化验总次数最少的n的值.参考数据:若Z~N(μ,σ2),则P(μ−σ<Z<μ+σ)=0.6826,P(μ−2σ<Z<μ+2σ)=0.9544,P(μ−3σ<Y<μ+3σ)=0.9973,0.94≈0.66,0.95≈0.59,0.910≈0.35.
年初,新冠肺炎疫情袭击全国,某省由于人员流动性较大,成为湖北省外疫情最严重的省份之一,截至月日,该省己累计确诊例患者(无境外输入病例).
为了解新冠肺炎的相关特征,研究人员从该省随机抽取名确诊患者,统计他们的年龄数据,得下面的频数分布表:
| 年龄 | | | | | | | | | |
| 人数 |
由频数分布表可以大致认为,该省新冠肺炎患者的年龄服从正态分布,其中近似为这名患者年龄的样本平均数(同一组中的数据用该组区间的中点值作代表).请估计该省新冠肺炎患者年龄在岁以上的患者比例.
截至月日,该省新冠肺炎的密切接触者(均已接受检测)中确诊患者约占,以这些密切接触者确诊的频率代替名密切接触者确诊发生的概率,每名密切接触者是否确诊相互独立.现有密切接触者人,为检测出所有患者,设计了如下方案:将这名密切接触者随机地按(且是的约数)个人一组平均分组,并将同组的个人每人抽取的一半血液混合在一起化验,若发现新冠病毒,则对该组的个人抽取的另一半血液逐一化验,记个人中患者的人数为,以化验次数的期望值为决策依据,试确定使得人的化验总次数最少的的值.
参考数据:若~,则,,,,,.
题目解答
答案
- (1)
.
- (2)
.
解析
第一问:
本题需要利用正态分布的性质,结合样本平均数计算患者年龄在70岁以上的比例。
- 核心思路:先计算样本平均数$\mu$,再根据正态分布$Z \sim N(\mu, 15.2^2)$,求出$P(Z \geq 70)$。
- 关键点:
- 频数分布表计算平均数:用各组中点值乘以频数求和,再除以总人数。
- 正态分布对称性:利用参考数据中$\mu + \sigma$对应的概率,直接得出右侧概率。
第二问:
本题需通过期望值比较不同分组方式下的总化验次数,找到最优分组大小$n$。
- 核心思路:
- 分组策略:每组$n$人,若混合检测阳性,则需额外逐一检测。
- 期望计算:总次数为$\frac{20}{n} + 20 \cdot [1 - (0.9)^n]$,需计算不同$n$的值并比较。
- 关键点:
- 二项分布:患者人数$X_n \sim \text{Binomial}(n, 0.1)$,混合检测阳性的概率为$1 - (0.9)^n$。
- 参考数据:直接代入$0.9^n$的近似值简化计算。
第(1)题
步骤1:计算样本平均数$\mu$
根据频数分布表,计算各组中点值与频数的乘积之和:
$\begin{aligned}\mu &= \frac{1}{100} \left[ 15 \times 2 + 25 \times 6 + 35 \times 12 + 45 \times 18 + 55 \times 22 + 65 \times 22 + 75 \times 12 + 85 \times 4 + 95 \times 2 \right] \\&= \frac{5480}{100} = 54.8.\end{aligned}$
步骤2:计算$P(Z \geq 70)$
标准化得:
$Z = \frac{70 - \mu}{\sigma} = \frac{70 - 54.8}{15.2} = 1.$
根据正态分布性质,$P(\mu - \sigma < Z < \mu + \sigma) = 0.6826$,因此右侧概率为:
$P(Z \geq 70) = \frac{1 - 0.6826}{2} = 0.1587 = 15.87\%.$
第(2)题
步骤1:建立总化验次数的期望表达式
每组化验次数的期望为:
$E(\text{次数}) = 1 + n \cdot P(X_n \geq 1) = 1 + n \cdot [1 - (0.9)^n].$
总次数为:
$\text{总次数} = \frac{20}{n} \cdot \left[ 1 + n \cdot (1 - 0.9^n) \right] = \frac{20}{n} + 20 \cdot (1 - 0.9^n).$
步骤2:代入参考数据计算不同$n$的值
- $n=4$:
$\text{总次数} = \frac{20}{4} + 20 \cdot (1 - 0.9^4) = 5 + 20 \cdot (1 - 0.66) = 5 + 6.8 = 11.8.$ - $n=2$:
$\text{总次数} = 10 + 20 \cdot (1 - 0.81) = 13.8.$ - $n=5$:
$\text{总次数} = 4 + 20 \cdot (1 - 0.59) = 12.19.$ - $n=10$:
$\text{总次数} = 2 + 20 \cdot (1 - 0.35) = 15.02.$
步骤3:比较结果
$n=4$时总次数最小,故最优分组大小为$4$。