题目
下表包含了8个学生的ACT分数和GPA(平均成绩)。平均成绩以四分制计算,且保留一位小数。 (1)利用OLS估计GPA和ACT的关系;也就是说,求出如下方程中的截距和斜率估计值 评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果ACT分数提高5分,预期GPA会提高多少? (2)计算每次观测的拟合值和残差,并验证残差和(近似)为零。 (3)当ACT=20时,GPA的预测[1]值为多少? (4)对这8个学生来说,GPA的波动中,有多少能由ACT解释?试说明。
下表包含了8个学生的ACT分数和GPA(平均成绩)。平均成绩以四分制计算,且保留一位小数。 (1)利用OLS估计GPA和ACT的关系;也就是说,求出如下方程中的截距和斜率估计值 评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果ACT分数提高5分,预期GPA会提高多少? (2)计算每次观测的拟合值和残差,并验证残差和(近似)为零。 (3)当ACT=20时,GPA的预测[1]值为多少? (4)对这8个学生来说,GPA的波动中,有多少能由ACT解释?试说明。
题目解答
答案
答案:(1)变量的均值为: 根据OLS估计量的公式可得:β∧1=5.8125/56.875=0.1022; 所以β∧0=3.2125-0.1022×25.875=0.5681; 因此 此处截距没有一个很好的解释,因为对样本而言,ACT并不接近0。如果ACT分数提高5分,预期GPA会提高0.1022×5=0.511。 (2)每次观测的拟合值和残差表如表2-1所示: 表2-1 根据表可知,残差和为-0.0002,忽略固有的舍入误差,残差和近似为零。 (3)当ACT=20,则 (4)残差平方和为: 而 则判定系数为:R2=1-SSR/SST=1-0.4347/1.0288≈0.577。 GPA的变异中,有57.7%能由ACT解释。解析:空
解析
步骤 1:计算变量的均值
首先,我们需要计算ACT和GPA的均值。根据题目给出的数据,我们有:
- ACT的均值为:\( \bar{X} = 25.875 \)
- GPA的均值为:\( \bar{Y} = 3.2125 \)
步骤 2:计算斜率和截距
根据OLS估计量的公式,我们可以计算出斜率和截距:
- 斜率 \( \beta_1 \) 的计算公式为:\( \beta_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2} \)
- 截距 \( \beta_0 \) 的计算公式为:\( \beta_0 = \bar{Y} - \beta_1 \bar{X} \)
根据题目给出的数据,我们有:
- \( \sum (X_i - \bar{X})(Y_i - \bar{Y}) = 5.8125 \)
- \( \sum (X_i - \bar{X})^2 = 56.875 \)
因此,斜率 \( \beta_1 \) 为:
\[ \beta_1 = \frac{5.8125}{56.875} = 0.1022 \]
截距 \( \beta_0 \) 为:
\[ \beta_0 = 3.2125 - 0.1022 \times 25.875 = 0.5681 \]
步骤 3:计算拟合值和残差
根据斜率和截距,我们可以计算出每次观测的拟合值和残差。拟合值 \( \hat{Y} \) 的计算公式为:
\[ \hat{Y} = \beta_0 + \beta_1 X \]
残差 \( e \) 的计算公式为:
\[ e = Y - \hat{Y} \]
根据题目给出的数据,我们有:
- 当ACT=20时,GPA的预测值为:
\[ \hat{Y} = 0.5681 + 0.1022 \times 20 = 2.6121 \]
步骤 4:计算残差和
根据题目给出的数据,我们有:
- 残差和为:\( \sum e = -0.0002 \)
忽略固有的舍入误差,残差和近似为零。
步骤 5:计算判定系数
根据题目给出的数据,我们有:
- 残差平方和为:\( SSR = 0.4347 \)
- 总平方和为:\( SST = 1.0288 \)
判定系数 \( R^2 \) 的计算公式为:
\[ R^2 = 1 - \frac{SSR}{SST} \]
因此,判定系数 \( R^2 \) 为:
\[ R^2 = 1 - \frac{0.4347}{1.0288} \approx 0.577 \]
首先,我们需要计算ACT和GPA的均值。根据题目给出的数据,我们有:
- ACT的均值为:\( \bar{X} = 25.875 \)
- GPA的均值为:\( \bar{Y} = 3.2125 \)
步骤 2:计算斜率和截距
根据OLS估计量的公式,我们可以计算出斜率和截距:
- 斜率 \( \beta_1 \) 的计算公式为:\( \beta_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2} \)
- 截距 \( \beta_0 \) 的计算公式为:\( \beta_0 = \bar{Y} - \beta_1 \bar{X} \)
根据题目给出的数据,我们有:
- \( \sum (X_i - \bar{X})(Y_i - \bar{Y}) = 5.8125 \)
- \( \sum (X_i - \bar{X})^2 = 56.875 \)
因此,斜率 \( \beta_1 \) 为:
\[ \beta_1 = \frac{5.8125}{56.875} = 0.1022 \]
截距 \( \beta_0 \) 为:
\[ \beta_0 = 3.2125 - 0.1022 \times 25.875 = 0.5681 \]
步骤 3:计算拟合值和残差
根据斜率和截距,我们可以计算出每次观测的拟合值和残差。拟合值 \( \hat{Y} \) 的计算公式为:
\[ \hat{Y} = \beta_0 + \beta_1 X \]
残差 \( e \) 的计算公式为:
\[ e = Y - \hat{Y} \]
根据题目给出的数据,我们有:
- 当ACT=20时,GPA的预测值为:
\[ \hat{Y} = 0.5681 + 0.1022 \times 20 = 2.6121 \]
步骤 4:计算残差和
根据题目给出的数据,我们有:
- 残差和为:\( \sum e = -0.0002 \)
忽略固有的舍入误差,残差和近似为零。
步骤 5:计算判定系数
根据题目给出的数据,我们有:
- 残差平方和为:\( SSR = 0.4347 \)
- 总平方和为:\( SST = 1.0288 \)
判定系数 \( R^2 \) 的计算公式为:
\[ R^2 = 1 - \frac{SSR}{SST} \]
因此,判定系数 \( R^2 \) 为:
\[ R^2 = 1 - \frac{0.4347}{1.0288} \approx 0.577 \]