题目
我们要进行数据预处理,是因为原始数据大多都是()A. 不准确数据B. 脏数据C. 不完整数据D. 不安全数据
我们要进行数据预处理,是因为原始数据大多都是()
A. 不准确数据
B. 脏数据
C. 不完整数据
D. 不安全数据
题目解答
答案
B. 脏数据
解析
数据预处理是数据分析或机器学习中的关键步骤,其核心目的是提升数据质量,确保数据适合后续处理。原始数据往往存在噪声、错误、不一致、缺失值等问题,这些问题统称为“脏数据”。题目中的其他选项(如不准确、不完整、不安全)虽然也是数据问题,但“脏数据”更全面地概括了数据预处理的主要目标。
选项分析
- A. 不准确数据:仅指数据存在误差或错误,但未涵盖缺失值、格式问题等。
- B. 脏数据:包含所有数据质量问题(如噪声、重复、格式错误、缺失值等),是数据预处理的核心处理对象。
- C. 不完整数据:特指数据缺失,范围较窄。
- D. 不安全数据:涉及隐私或安全问题,属于数据保护范畴,非预处理主要目标。
结论:数据预处理的主要原因是处理脏数据,因此正确答案为B。