题目
数据分析时发现某数据偏离均值3倍标准差,应? A. 检查是否录入错误B. 直接删除C. 修改为平均值D. 忽略不管
数据分析时发现某数据偏离均值3倍标准差,应?
- A. 检查是否录入错误
- B. 直接删除
- C. 修改为平均值
- D. 忽略不管
题目解答
答案
A
解析
考查要点:本题主要考查对异常值处理原则的理解,以及在数据分析中遇到异常数据时的正确应对策略。
解题核心思路:
当数据偏离均值超过3倍标准差时,通常被视为异常值。此时需优先检查数据来源的可靠性,而非直接修改或删除数据。录入错误是最常见的异常值原因之一,因此第一步应验证数据准确性。
破题关键点:
- 异常值的定义:通常认为超出均值±3倍标准差的数据为异常值。
- 处理优先级:异常值处理的第一步是检查数据质量,而非直接调整数据。
异常值的处理逻辑:
- 检查数据录入:确认数据是否因输入错误、测量误差等原因导致异常。
- 验证合理性:若数据真实有效,需判断是否属于数据分布的自然范围。
- 决定处理方式:根据具体情况选择保留、修正或删除(需谨慎)。
选项分析:
- A. 检查是否录入错误:正确。异常值出现时,首要任务是验证数据准确性。
- B. 直接删除:错误。删除可能破坏样本代表性,尤其在小样本中影响较大。
- C. 修改为平均值:错误。修改数据会改变原始分布,导致偏差。
- D. 忽略不管:错误。若异常值存在问题,可能影响分析结果的有效性。