题目
以下关于异常值检测的说法中错误的是()A. 使用箱线图方法时要求数据服从或近似服从正态分布B. 基于聚类的方法可以进行离群点检测C. 3σ原则利用了统计学中小概率事件的原理D. 基于分类的方法可以进行离群点检测
以下关于异常值检测的说法中错误的是()
A. 使用箱线图方法时要求数据服从或近似服从正态分布
B. 基于聚类的方法可以进行离群点检测
C. 3σ原则利用了统计学中小概率事件的原理
D. 基于分类的方法可以进行离群点检测
题目解答
答案
D. 基于分类的方法可以进行离群点检测
解析
本题考查异常值检测方法的相关概念,需明确各方法的适用条件及原理。关键点在于区分不同异常检测方法的类型(如统计方法、聚类方法、分类方法)及其应用场景。需注意:
- 箱线图法基于四分位距(IQR),不依赖数据正态分布;
- 3σ原则基于正态分布假设,利用小概率事件原理;
- 聚类方法(如LOF)常用于离群点检测;
- 分类方法通常需标签数据,而离群检测多为无监督,故不适用。
选项分析
A. 使用箱线图方法时要求数据服从或近似服从正态分布
错误。箱线图通过四分位数计算IQR,无需数据正态分布,适用于任意分布类型。
B. 基于聚类的方法可以进行离群点检测
正确。聚类方法(如LOF、DBSCAN)常用于识别离群点,属于典型应用。
C. 3σ原则利用了统计学中小概率事件的原理
正确。3σ原则假设数据正态分布,认为超过3个标准差外的数据为异常(概率约0.3%)。
D. 基于分类的方法可以进行离群点检测
错误。分类方法需有标签数据(监督学习),而离群检测多为无监督,分类方法不直接用于离群检测。