题目
以下关于逻辑回归的说法错误的是() A. 逻辑回归对模型中自变量的多重共线性较为敏感B. 逻辑回归的自变量必须是分类变量,因此要对连续性变量进行离散化处理C. 应用逻辑回归时,异常值会对模型造成很大的干扰D. 逻辑回归属于分类算法
以下关于逻辑回归的说法错误的是()
- A. 逻辑回归对模型中自变量的多重共线性较为敏感
- B. 逻辑回归的自变量必须是分类变量,因此要对连续性变量进行离散化处理
- C. 应用逻辑回归时,异常值会对模型造成很大的干扰
- D. 逻辑回归属于分类算法
题目解答
答案
B
解析
考查要点:本题主要考查对逻辑回归基本概念的理解,特别是对自变量类型、模型特点及应用限制的辨析。
解题核心思路:
- 明确逻辑回归的定义与适用场景:逻辑回归属于分类算法,其核心是通过sigmoid函数将线性组合映射到概率空间。
- 分析选项的关键点:
- 选项B是否定逻辑回归对连续变量的处理能力,需结合逻辑回归的数学形式判断。
- 其他选项需结合逻辑回归的常见问题(如多重共线性、异常值敏感性)进行验证。
破题关键:
- 逻辑回归的自变量类型:逻辑回归允许自变量为连续或分类变量,但分类变量需通过虚拟变量处理。
- 离散化处理的必要性:连续变量无需强制离散化,直接使用更优。
选项分析
选项A
逻辑回归对多重共线性敏感
逻辑回归基于最大似然估计,多重共线性会导致系数估计不稳定、解释难度增加。因此该说法正确。
选项B
自变量必须是分类变量,需离散化处理
错误。逻辑回归的自变量可以是连续或分类变量。连续变量可直接使用(如年龄、收入),分类变量需通过虚拟变量编码(如性别、职业)。强制离散化会损失信息,影响模型性能。
选项C
异常值会干扰模型
逻辑回归的目标函数(对数似然)对异常值敏感,异常样本可能显著改变系数估计。因此该说法正确。
选项D
逻辑回归属于分类算法
逻辑回归通过sigmoid函数输出概率,常用于二分类问题(如违约/不违约)。因此该说法正确。