【判断题】4 、多元线性回归中,可决系数 R 2 是评价模型拟合优度[1]好坏的最佳标准。 () (6.0分)
题目解答
答案
解析
本题考查多元线性回归中可决系数 $R^{2}$ 与模型拟合优度评价标准的相关知识。解题思路是明确可决系数 $R^{2}$ 的含义和作用,同时了解在多元线性回归中评价模型拟合优度的其他因素,通过对比判断该说法是否正确。
1. 明确可决系数 $R^{2}$ 的含义
可决系数 $R^{2}$ 的计算公式为:
$R^{2}=\frac{ESS}{TSS}=1 - \frac{RSS}{TSS}$
其中,$ESS=\sum_{i = 1}^{n}(\hat{y}_{i}-\overline{y})^{2}$ 是回归平方和,反映了由解释变量解释的那部分离差平方和;$TSS=\sum_{i = 1}^{n}(y_{i}-\overline{y})^{2}$ 是总离差平方和,反映了被解释变量的总波动;$RSS=\sum_{i = 1}^{n}(y_{i}-\hat{y}_{i})^{2}$ 是残差平方和,反映了不能由解释变量解释的那部分离差平方和。
可决系数 $R^{2}$ 越接近 1,说明回归平方和占总离差平方和的比例越大,即模型对样本数据的拟合程度越好。
2. 分析可决系数 $R^{2}$ 不是最佳标准的原因
在多元线性回归中,当模型中增加一个解释变量时,即使这个解释变量在经济意义上没有实际的解释能力,$R^{2}$ 也会增大。这是因为 $R^{2}$ 是一个相对值,它会随着解释变量个数的增加而单调不减。
为了克服这一缺点,人们学家学家提出了调整的可决系数 $\overline{R}^{2}$,其计算公式为:
$\overline{R}^{2}=1-\frac{RSS/(n - k - 1)}{TSS/(n - 1)}$
其中,$n$ 是样本容量,$k$ 是解释变量的个数。调整的可决系数 $\overline{R}^{2}$ 考虑了模型中解释变量的个数,在比较不同模型的拟合优度时,$\overline{R}^{2}$ 比 $R^{2}$ 更合适。
此外,评价模型拟合优度还需要考虑其他因素,如模型的经济意义、变量的显著性等。因此,可决系数 $R^{2}$ 不是评价模型拟合优度好坏的最佳标准。