题目
数据清理的原则包括()。A. 连续性原则B. 相异性原则C. 唯一性原则D. 空值原则
数据清理的原则包括()。
A. 连续性原则
B. 相异性原则
C. 唯一性原则
D. 空值原则
题目解答
答案
ACD
A. 连续性原则
C. 唯一性原则
D. 空值原则
A. 连续性原则
C. 唯一性原则
D. 空值原则
解析
数据清理是数据预处理的重要环节,其核心目标是确保数据的准确性、完整性和一致性。本题考查对数据清理原则的理解,需明确各选项是否属于数据清理的基本原则:
- 连续性原则:强调数据在时间或逻辑上的连贯性,避免关键信息缺失。
- 唯一性原则:确保数据记录或标识字段的唯一性,防止重复或冗余。
- 空值原则:规范处理缺失值,如填补、删除或标注,保证数据可用性。
- 相异性原则:更偏向数据分类或特征分析,非数据清理的核心原则。
选项分析
A. 连续性原则
数据清理需保证数据在关键维度(如时间、空间)上的连贯性。例如,时间序列数据若存在间隔缺失,需通过插值或标注方式处理,因此属于数据清理原则。
B. 相异性原则
相异性强调数据间的差异性,常见于分类或聚类任务中,但数据清理更关注数据的完整性和一致性,而非差异性,故不属于数据清理原则。
C. 唯一性原则
数据清理需确保主键、唯一标识字段的唯一性,避免重复记录,是数据清理的核心原则之一。
D. 空值原则
缺失值处理是数据清理的关键步骤,需根据业务逻辑选择填充、删除或保留空值,因此属于数据清理原则。