题目

2020年初，新冠肺炎疫情袭击全国，某省由于人员流动性较大，成为湖北省外疫情最严重的省份之一，截至2月29日，该省己累计确诊1349例患者（无境外输入病例）．为了解新冠肺炎的相关特征，研究人员从该省随机抽取100名确诊患者，统计他们的年龄数据，得下面的频数分布表：年龄 [10,20] (20,30] (30,40] (40,50] (50,60] (60,70] (70,80] (80,90] (90,100] 人数 2 6 12 18 22 22 12 4 2 由频数分布表可以大致认为，该省新冠肺炎患者的年龄Z服从正态分布N(μ,15.22)，其中μ近似为这100名患者年龄的样本平均数（同一组中的数据用该组区间的中点值作代表）．请估计该省新冠肺炎患者年龄在70岁以上(⩾70)的患者比例．截至2月29日，该省新冠肺炎的密切接触者（均已接受检测）中确诊患者约占10%，以这些密切接触者确诊的频率代替1名密切接触者确诊发生的概率，每名密切接触者是否确诊相互独立．现有密切接触者20人，为检测出所有患者，设计了如下方案：将这20名密切接触者随机地按n（1<n<20且n是20的约数）个人一组平均分组，并将同组的n个人每人抽取的一半血液混合在一起化验，若发现新冠病毒，则对该组的n个人抽取的另一半血液逐一化验，记n个人中患者的人数为Xn，以化验次数的期望值为决策依据，试确定使得20人的化验总次数最少的n的值．参考数据：若Z~N(μ,σ2)，则P(μ−σ<Z<μ+σ)=0.6826，P(μ−2σ<Z<μ+2σ)=0.9544，P(μ−3σ<Y<μ+3σ)=0.9973，0.94≈0.66，0.95≈0.59，0.910≈0.35．

年初，新冠肺炎疫情袭击全国，某省由于人员流动性较大，成为湖北省外疫情最严重的省份之一，截至月日，该省己累计确诊例患者（无境外输入病例）．

为了解新冠肺炎的相关特征，研究人员从该省随机抽取名确诊患者，统计他们的年龄数据，得下面的频数分布表：

年龄
人数

由频数分布表可以大致认为，该省新冠肺炎患者的年龄服从正态分布，其中近似为这名患者年龄的样本平均数（同一组中的数据用该组区间的中点值作代表）．请估计该省新冠肺炎患者年龄在岁以上的患者比例．

截至月日，该省新冠肺炎的密切接触者（均已接受检测）中确诊患者约占，以这些密切接触者确诊的频率代替名密切接触者确诊发生的概率，每名密切接触者是否确诊相互独立．现有密切接触者人，为检测出所有患者，设计了如下方案：将这名密切接触者随机地按（且是的约数）个人一组平均分组，并将同组的个人每人抽取的一半血液混合在一起化验，若发现新冠病毒，则对该组的个人抽取的另一半血液逐一化验，记个人中患者的人数为，以化验次数的期望值为决策依据，试确定使得人的化验总次数最少的的值．

参考数据：若~，则，，，，，．

题目解答

答案

(1)
．
(2)
．

解析

第一问：
本题需要利用正态分布的性质，结合样本平均数计算患者年龄在70岁以上的比例。

核心思路：先计算样本平均数$\mu$，再根据正态分布$Z \sim N(\mu, 15.2^2)$，求出$P(Z \geq 70)$。
关键点：
- 频数分布表计算平均数：用各组中点值乘以频数求和，再除以总人数。
- 正态分布对称性：利用参考数据中$\mu + \sigma$对应的概率，直接得出右侧概率。

第二问：
本题需通过期望值比较不同分组方式下的总化验次数，找到最优分组大小$n$。

核心思路：
- 分组策略：每组$n$人，若混合检测阳性，则需额外逐一检测。
- 期望计算：总次数为$\frac{20}{n} + 20 \cdot [1 - (0.9)^n]$，需计算不同$n$的值并比较。
关键点：
- 二项分布：患者人数$X_n \sim \text{Binomial}(n, 0.1)$，混合检测阳性的概率为$1 - (0.9)^n$。
- 参考数据：直接代入$0.9^n$的近似值简化计算。

第（1）题

步骤1：计算样本平均数$\mu$
根据频数分布表，计算各组中点值与频数的乘积之和：
$\begin{aligned}\mu &= \frac{1}{100} \left[ 15 \times 2 + 25 \times 6 + 35 \times 12 + 45 \times 18 + 55 \times 22 + 65 \times 22 + 75 \times 12 + 85 \times 4 + 95 \times 2 \right] \\&= \frac{5480}{100} = 54.8.\end{aligned}$

步骤2：计算$P(Z \geq 70)$
标准化得：
$Z = \frac{70 - \mu}{\sigma} = \frac{70 - 54.8}{15.2} = 1.$
根据正态分布性质，$P(\mu - \sigma < Z < \mu + \sigma) = 0.6826$，因此右侧概率为：
$P(Z \geq 70) = \frac{1 - 0.6826}{2} = 0.1587 = 15.87\%.$

第（2）题

步骤1：建立总化验次数的期望表达式
每组化验次数的期望为：
$E(\text{次数}) = 1 + n \cdot P(X_n \geq 1) = 1 + n \cdot [1 - (0.9)^n].$
总次数为：
$\text{总次数} = \frac{20}{n} \cdot \left[ 1 + n \cdot (1 - 0.9^n) \right] = \frac{20}{n} + 20 \cdot (1 - 0.9^n).$

步骤2：代入参考数据计算不同$n$的值

$n=4$：
$\text{总次数} = \frac{20}{4} + 20 \cdot (1 - 0.9^4) = 5 + 20 \cdot (1 - 0.66) = 5 + 6.8 = 11.8.$
$n=2$：
$\text{总次数} = 10 + 20 \cdot (1 - 0.81) = 13.8.$
$n=5$：
$\text{总次数} = 4 + 20 \cdot (1 - 0.59) = 12.19.$
$n=10$：
$\text{总次数} = 2 + 20 \cdot (1 - 0.35) = 15.02.$

步骤3：比较结果
$n=4$时总次数最小，故最优分组大小为$4$。