题目
对数据进行标准化的主要目的是:A. 将数据转换为正态分布B. 消除不同单位或量纲的影响C. 处理缺失值D. 识别异常值
对数据进行标准化的主要目的是:
A. 将数据转换为正态分布
B. 消除不同单位或量纲的影响
C. 处理缺失值
D. 识别异常值
题目解答
答案
B. 消除不同单位或量纲的影响
解析
数据标准化的核心目的是解决不同特征之间量纲不一致的问题。例如,身高(米)和体重(公斤)直接比较时,量级差异会影响分析结果。标准化通过缩放使数据具有可比性,确保每个特征对模型的贡献相同。本题需明确标准化与正态化、缺失值处理、异常值检测等概念的区别。
选项分析
A. 将数据转换为正态分布
标准化(如Z-score标准化)的目标是调整数据分布的均值和标准差,但不保证数据服从正态分布。若需正态化,通常需额外处理(如对数转换)。因此此选项错误。
B. 消除不同单位或量纲的影响
正确。标准化通过缩放消除量纲差异。例如,将温度(℃)和湿度(%)统一到相同尺度,使分析结果公平合理。
C. 处理缺失值
缺失值处理属于数据清洗范畴,与标准化无关。标准化假设数据已完整,因此此选项错误。
D. 识别异常值
标准化可能间接暴露异常值,但并非主要目的。识别异常值需单独的方法(如箱线图、Z-score检测),因此此选项错误。