logonew chat icon top
  • icon-chaticon-chat-active搜题/提问
    new chat icon
    新建会话
  • icon-calculatoricon-calculator-active计算器
  • icon-subjecticon-subject-active学科题目
  • icon-pluginicon-plugin-active浏览器插件
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
recent chat icon
历史记录
首页
/
统计
题目

在1500件产品中有400件次品、1100件正品,任取200件。(1) 求恰有90件次品的概率。(2) 求至少有2件次品的概率。

在1500件产品中有400件次品、1100件正品,任取200件。 (1) 求恰有90件次品的概率。 (2) 求至少有2件次品的概率。

题目解答

答案

我们来逐步分析并解答这个题目。

题目已知条件:

  • 总产品数:1500 件
  • 次品数:400 件
  • 正品数:1100 件
  • 从中任取 200 件(不放回抽样)

这是一个超几何分布(Hypergeometric Distribution)的问题,因为是从有限总体中不放回地抽取样本。

(1) 求恰有 90 件次品的概率

我们要计算:从 200 件中恰好有 90 件次品的概率。

超几何分布公式:

从 $ N $ 个产品中,有 $ D $ 个次品,抽取 $ n $ 个样本,其中恰好有 $ k $ 个次品的概率为:

$P(X = k) = \frac{\binom{D}{k} \binom{N - D}{n - k}}{\binom{N}{n}}$

代入本题数据:

  • $ N = 1500 $(总数)
  • $ D = 400 $(次品数)
  • $ N - D = 1100 $(正品数)
  • $ n = 200 $(抽取数)
  • $ k = 90 $(要求的次品数)

所以:

$P(X = 90) = \frac{\binom{400}{90} \binom{1100}{110}}{\binom{1500}{200}}$

> 注:因为 $ 200 - 90 = 110 $,所以正品有 110 件。

这个概率如何计算?

由于数字非常大(组合数极大),无法手工计算,通常需要用计算机或近似方法。

但我们仍可以表达出精确公式,并说明其计算方式。

是否可以使用近似?

由于总体较大(1500),样本也较大(200),但抽样比例为 $ \frac{200}{1500} \approx 13.3\% $,不算特别小,所以不完全满足二项分布近似条件(通常要求抽样比例小,且总体大时用二项近似)。

但我们可以考虑用正态近似或泊松近似,但最合适的还是超几何分布的精确表达式,或使用软件计算。

但题目要求“求概率”,我们应给出表达式,并说明是否可计算。

结论(1):

恰有 90 件次品的概率为:

$\boxed{P(X = 90) = \frac{\binom{400}{90} \binom{1100}{110}}{\binom{1500}{200}}}$

这个值非常小,但可以使用统计软件(如 R、Python)进行数值计算。

例如,在 R 中可用:

dhyper(90, 400, 1100, 200)

但手工无法精确计算,因此我们保留组合数表达式作为答案。

(2) 求至少有 2 件次品的概率

即:

$P(X \geq 2) = 1 - P(X = 0) - P(X = 1)$

我们分别计算 $ P(X = 0) $ 和 $ P(X = 1) $,然后用 1 减去。

计算 $ P(X = 0) $:

表示 200 件全是正品。

$P(X = 0) = \frac{\binom{400}{0} \binom{1100}{200}}{\binom{1500}{200}} = \frac{1 \cdot \binom{1100}{200}}{\binom{1500}{200}}$

计算 $ P(X = 1) $:

表示有 1 件次品,199 件正品。

$P(X = 1) = \frac{\binom{400}{1} \binom{1100}{199}}{\binom{1500}{200}} = \frac{400 \cdot \binom{1100}{199}}{\binom{1500}{200}}$

所以:

$P(X \geq 2) = 1 - \frac{\binom{1100}{200} + 400 \cdot \binom{1100}{199}}{\binom{1500}{200}}$

这个概率有多大?

我们可以通过直觉判断:

  • 次品率:$ \frac{400}{1500} \approx 26.67\% $
  • 抽取 200 件,期望次品数为:$ 200 \times \frac{400}{1500} = \frac{80000}{1500} \approx 53.33 $ 件

所以平均有约 53 件次品。

因此,没有次品或只有 1 件次品的概率极小。

所以 $ P(X \geq 2) $ 非常接近 1。

但我们仍要给出精确表达式。

最终答案:

(1) 恰有 90 件次品的概率为:

$\boxed{P = \frac{\binom{400}{90} \binom{1100}{110}}{\binom{1500}{200}}}$

(2) 至少有 2 件次品的概率为:

$\boxed{P = 1 - \frac{\binom{1100}{200} + 400 \cdot \binom{1100}{199}}{\binom{1500}{200}}}$

补充说明:

  • 这两个概率的组合数极大,实际计算需借助计算机。
  • 但从实际意义看,(2) 的概率非常接近 1,因为期望次品数为 53.33,几乎不可能只抽到 0 或 1 件次品。
  • (1) 中 90 件次品高于期望值(53.33),属于较远的尾部,概率也很小,但比 $ P(X=0) $ 或 $ P(X=1) $ 大得多。

✅ 总结:

题目是典型的超几何分布问题,由于不放回抽样,不能使用二项分布。

最终答案以组合数形式表达是标准做法,除非题目要求近似数值。

解析

考查要点:本题属于超几何分布的应用问题,考查从有限总体中不放回抽样的概率计算能力,以及利用补集思想处理“至少”型概率问题。

解题核心思路:

  1. 超几何分布公式:直接应用公式计算特定次品数的概率;
  2. 补集法:将“至少有2件次品”转化为“1 - (全是正品 + 恰好1件次品)”,简化计算。

破题关键点:

  • 明确问题类型:不放回抽样,必须使用超几何分布;
  • 组合数的正确拆分:次品数与正品数需满足总数约束;
  • 数值特性判断:通过期望值(约53件次品)快速判断概率合理性。

第(1)题

应用超几何分布公式

从1500件中抽取200件,恰有90件次品的概率为:
$P(X=90) = \frac{\binom{400}{90} \binom{1100}{110}}{\binom{1500}{200}}$

  • 关键点:次品数90对应$\binom{400}{90}$,正品数110对应$\binom{1100}{110}$,分母为总抽取方式$\binom{1500}{200}$。

第(2)题

补集法拆分概率

至少2件次品的概率为:
$P(X \geq 2) = 1 - P(X=0) - P(X=1)$

计算$P(X=0)$

全部抽取正品:
$P(X=0) = \frac{\binom{400}{0} \binom{1100}{200}}{\binom{1500}{200}} = \frac{\binom{1100}{200}}{\binom{1500}{200}}$

计算$P(X=1)$

抽取1件次品和199件正品:
$P(X=1) = \frac{\binom{400}{1} \binom{1100}{199}}{\binom{1500}{200}} = \frac{400 \cdot \binom{1100}{199}}{\binom{1500}{200}}$

合并结果

$P(X \geq 2) = 1 - \frac{\binom{1100}{200} + 400 \cdot \binom{1100}{199}}{\binom{1500}{200}}$

相关问题

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 聚类分析的常见应用领域不包括( )A. 数据分析B. 图像处理C. 客户分割D. 发现关联购买行为

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 关于样本中某一变量的综合描述叫( )A. 统计值B. 平均值C. 估计值D. 参数值

  • 下列说法正确的是() A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 决策树算法常用的划分准则包括: A. 信息增益B. 基尼指数C. 误差平方和D. 均方差

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 区群谬误是用个体调查(分析)单位做资料收集与分析,却用集群乃至总体调查(分析)单位做结论。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 方差池化C. 协方差池化D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 下列关于回归分析的描述不正确的是()A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 从总体中抽取的、对总体有一定代表性的一部分个体称为()A. 总体B. 部分C. 样本D. 取样

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号