题目
在线性回归中,如果特征之间存在高度相关性,可能会导致什么问题?()A. 模型欠拟合B. 多重共线性问题C. 模型过拟合D. 无法找到最优解
在线性回归中,如果特征之间存在高度相关性,可能会导致什么问题?() A. 模型欠拟合 B. 多重共线性问题 C. 模型过拟合 D. 无法找到最优解
题目解答
答案
B
解析
考查要点:本题主要考查线性回归模型中特征相关性对模型的影响,特别是多重共线性问题的识别。
解题核心思路:
在线性回归中,多重共线性指的是特征变量之间存在高度相关性。这种情况下,模型的系数估计会变得不稳定,导致解释能力下降,但模型本身仍可通过最小二乘法求解。因此,需区分多重共线性与其他模型问题(如过拟合、欠拟合)的本质区别。
破题关键点:
- 多重共线性是特征高度相关的直接结果,而非模型复杂度或拟合程度的问题。
- 明确选项中“无法找到最优解”与“系数不稳定”的差异。
在线性回归中,若特征之间存在高度相关性,会导致以下问题:
-
多重共线性问题(选项B):
- 系数估计不准确:高度相关的特征会使回归系数的方差增大,导致系数估计值对数据微小变化敏感。
- 解释性下降:难以区分各特征对目标变量的独立贡献,系数符号可能与实际关系相反。
-
其他选项分析:
- 模型欠拟合(A):欠拟合通常由模型形式过于简单引起,与特征相关性无关。
- 模型过拟合(C):过拟合指模型对噪声敏感,与特征相关性无直接关系。
- 无法找到最优解(D):最小二乘法仍可求解,但解的稳定性受影响。