题目
在确定数据中的离群点时,一般需要检查整个数据集。A. 对B. 错
在确定数据中的离群点时,一般需要检查整个数据集。
A. 对
B. 错
题目解答
答案
B. 错
解析
本题考查数据离群点检测的基本概念,关键在于理解离群点检测是否必须检查整个数据集。
核心思路:离群点检测的方法多样,不同场景下可能采用不同的策略。例如,大数据场景中可能通过抽样或特定算法减少计算量,因此并非所有情况都需要检查完整数据集。需明确题目中“一般需要”的表述是否合理。
关键分析步骤
1. 理解离群点检测的定义
离群点是指数据中与其他数据点显著偏离的观测值。检测方法包括统计方法(如Z-score、IQR)、聚类方法等。
2. 分析“检查整个数据集”的必要性
- 统计方法(如基于IQR)需要计算整体分布特征(如四分位数),此时需遍历数据集。
- 高效算法或大数据场景:可能采用抽样或分布式计算,无需检查每个数据点。
- 特定维度分析:有时仅关注某特征维度的离群点,而非全局分析。
3. 判断题目表述是否绝对化
题目中“一般需要检查整个数据集”表述绝对,忽略了上述灵活处理方式,因此错误。