题目
缺失值填充的常用策略包括()。A 随机猜测B 众数填充C 均值填充D 中位数填充
缺失值填充的常用策略包括()。
A 随机猜测
B 众数填充
C 均值填充
D 中位数填充
题目解答
答案
在数据预处理中,缺失值填充是关键步骤,常用策略包括基于统计量的填充方法,如均值填充、中位数填充和众数填充。这些方法分别用数据集的平均值、中位数或出现频率最高的值来替代缺失值,以保留数据分布特征并减少信息损失。
-
均值填充适用于数据分布较对称、无明显异常值的情况;
-
中位数填充更 robust,适用于存在异常值或数据偏斜的情形;
-
众数填充适用于分类变量或离散型数据,尤其当某个值出现频率最高时;
-
随机猜测并非标准缺失值填充策略,它不具备统计依据,通常不被推荐用于正式数据清洗。
根据常见实践和工具实现(如 scikit-learn 的 SimpleImputer),均值、中位数、众数均为标准填充策略。因此,选项 B、C、D 均属于常用策略。
而选项 A “随机猜测”不属于标准缺失值填充策略,不应被列为常用方法。
综上,正确答案应包含 B、C、D。
答案:
B, C, D