题目
处理随机数据时,误差落在哪个置信区间的数据被认为是可疑数据,应予剔除?A. (-σ,+σ)以外B. (-2σ,+2σ)以外C. (-3σ,+3σ)以外D. (-6σ,+6σ)以外
处理随机数据时,误差落在哪个置信区间的数据被认为是可疑数据,应予剔除?
A. (-σ,+σ)以外
B. (-2σ,+2σ)以外
C. (-3σ,+3σ)以外
D. (-6σ,+6σ)以外
题目解答
答案
C. (-3σ,+3σ)以外
解析
考查要点:本题主要考查统计学中置信区间与异常值判断标准的理解,特别是基于正态分布的经验法则(68-95-99.7法则)的应用。
解题核心思路:
根据正态分布的经验法则,数据分布在平均值μ附近,不同σ倍数对应的置信区间概率为:
- μ±σ覆盖约68%的数据
- μ±2σ覆盖约95%的数据
- μ±3σ覆盖约99.7%的数据
关键点:
- 超出3σ范围的数据仅占0.3%,属于极低概率事件,通常被视为可疑数据或异常值,需剔除。
根据正态分布的经验法则:
- 68%的数据分布在μ±σ范围内
- 95%的数据分布在μ±2σ范围内
- 99.7%的数据分布在μ±3σ范围内
因此,超出μ±3σ范围的数据仅占0.3%,属于统计学中的异常值,可能是测量误差或极端值,需剔除。选项C(-3σ,+3σ以外)符合这一标准。