题目
【单选题】在海量数据中,有少量数据与通常数据的行为特征不一样,在数据的某些属性方面有很大的差异。此时需要进行异常检测,异常检测的基本方法是寻找观测结果与参照值之间有意义的差别。下列哪项属于异常检测的方法?A. 平滑处理B. 建立离群点监测模型C. 数据标准化D. K-Means算法
【单选题】在海量数据中,有少量数据与通常数据的行为特征不一样,在数据的某些属性方面有很大的差异。此时需要进行异常检测,异常检测的基本方法是寻找观测结果与参照值之间有意义的差别。下列哪项属于异常检测的方法?
A. 平滑处理
B. 建立离群点监测模型
C. 数据标准化
D. K-Means算法
题目解答
答案
B. 建立离群点监测模型
解析
异常检测的核心目标是识别数据中与正常模式显著不同的个体或数据点。本题的关键在于理解各选项的应用场景:
- 平滑处理(A)用于消除噪声,属于数据预处理;
- 数据标准化(C)用于统一数据量纲,属于数据归一化;
- K-Means算法(D)是聚类算法,间接可发现离群点,但非专门方法;
- 建立离群点监测模型(B)直接针对异常检测,属于核心方法。
选项分析
A. 平滑处理
平滑处理通过技术手段(如移动平均)减少数据波动,无法直接识别异常,仅改善数据质量。
B. 建立离群点监测模型
离群点监测模型(如孤立森林、LOF算法)专门用于检测显著偏离正常模式的数据点,直接对应异常检测的核心需求。
C. 数据标准化
标准化(如归一化)使数据符合特定分布,属于数据预处理步骤,与异常检测无直接关联。
D. K-Means算法
K-Means通过聚类划分数据,离群点可能被识别为独立簇,但其主要目标是聚类而非检测异常,属于间接方法。