题目
离群值产生的可能原因不包括()。 A. 观察单位不属于研究总体目标人群B. 测量值为非正态分布中的一些极端值C. 以某变量的均数作为该变量缺失值的估计D. 数据录入错误
离群值产生的可能原因不包括()。
- A. 观察单位不属于研究总体目标人群
- B. 测量值为非正态分布中的一些极端值
- C. 以某变量的均数作为该变量缺失值的估计
- D. 数据录入错误
题目解答
答案
C
解析
离群值(异常值)的产生通常与数据质量、数据特性或处理方法有关。本题需判断哪一选项不属于离群值的可能原因。关键点在于理解各选项是否可能导致数据出现显著偏离的情况:
- A:若观察单位不属于研究总体,可能引入异质性数据;
- B:非正态分布本身可能包含极端值;
- C:用均值填补缺失值通常不会产生极端值;
- D:录入错误直接导致数据异常。
核心思路:排除与离群值无关的处理方法。
选项分析
A. 观察单位不属于研究总体目标人群
若数据来自不同总体(如研究成年人却包含儿童数据),可能导致离群值。属于可能原因。
B. 测量值为非正态分布中的一些极端值
非正态分布(如偏态分布)常伴随极端值,这些值可能被视为离群值。属于可能原因。
C. 以某变量的均数作为该变量缺失值的估计
用均值填补缺失值时,填补值接近数据中心位置,不会产生极端值。不会导致离群值。
D. 数据录入错误
错误录入(如小数点位置错误)会直接生成异常值。属于可能原因。