题目
2分数据清洗的方法不包括( )。A. 缺失值处理B. 噪声数据清除C. 一致性检查D. 重复数据记录处理
2分数据清洗的方法不包括( )。
A. 缺失值处理
B. 噪声数据清除
C. 一致性检查
D. 重复数据记录处理
题目解答
答案
D. 重复数据记录处理
解析
数据清洗的核心目标是提升数据质量,主要处理数据中的错误、缺失、噪声及不一致问题。本题需明确重复数据记录处理是否属于数据清洗的常规方法。关键点在于区分数据清洗与数据去重的边界:数据清洗侧重数据的“正确性”和“一致性”,而重复数据处理更偏向数据冗余管理,通常独立于清洗步骤。
选项分析
A. 缺失值处理
数据清洗中,缺失值是常见问题,需通过删除、插值等方法处理,属于核心步骤。
B. 噪声数据清除
噪声(如异常值、错误数据)直接影响分析结果,清除噪声是清洗必要环节。
C. 一致性检查
确保数据格式、单位等符合规范,是数据清洗的重要内容。
D. 重复数据记录处理
重复数据虽需处理,但主要解决冗余问题,属于数据整合或去重范畴,不属于数据清洗的核心方法。