题目
剔除一个远离回归直线的散点,回归平方和将( )。A.不受影响 B.减小 C.增大 D.接近于0
剔除一个远离回归直线的散点,回归平方和将( )。
A.不受影响
B.减小
C.增大
D.接近于0
题目解答
答案
1. 回归平方和的概念:
- 回归平方和是反映自变量与因变量之间的线性关系对因变量变异的贡献。
2. 分析剔除远离回归直线的散点的影响:
- 远离回归直线的散点对回归模型的影响较大,通常会使回归方程偏离真实的线性关系。
- 当剔除这个远离回归直线的散点后,回归方程会更接近其他数据点的真实线性关系,拟合效果会变好。
- 拟合效果变好意味着回归平方和会增大,因为回归平方和反映的是回归模型对因变量变异的解释程度,拟合效果好时,解释程度更高,回归平方和增大。
答案是 C。
解析
回归平方和(SSR)是衡量回归模型对因变量变异解释程度的指标,计算公式为:
$SSR = \sum (\hat{y}_i - \bar{y})^2$
其中,$\hat{y}_i$ 是预测值,$\bar{y}$ 是因变量平均值。
远离回归直线的散点通常具有较大的残差,对回归线的位置影响较大。剔除这类点后,回归线会更贴近剩余数据的真实线性关系,拟合效果提升,从而SSR增大。
-
回归平方和的性质
SSR反映自变量与因变量的线性关系对因变量变异的解释能力。拟合效果越好(回归线更贴近数据),SSR越大。 -
远离回归线的点的影响
- 远离回归线的点残差较大,导致原回归线偏离真实趋势。
- 剔除该点后,回归线调整,更符合剩余数据的分布,残差平方和(SSE)减小,而总平方和(SST)变化较小,因此 SSR = SST - SSE 增大。