题目
设 Y 表示实际观测值,hat(Y) 表示 OLS 估计回归值,则下列哪项成立A. hat(Y) = YB. hat(Y) = overline(Y)C. overline(hat{Y)} = YD. overline(hat{Y)} = overline(Y)
设 $Y$ 表示实际观测值,$\hat{Y}$ 表示 OLS 估计回归值,则下列哪项成立
A. $\hat{Y} = Y$
B. $\hat{Y} = \overline{Y}$
C. $\overline{\hat{Y}} = Y$
D. $\overline{\hat{Y}} = \overline{Y}$
题目解答
答案
D. $\overline{\hat{Y}} = \overline{Y}$
解析
本题考查普通最小二乘法(OLS)估计回归值的性质。解题的关键在于理解OLS估计的原理以及样本均值的计算,通过推导来判断各个选项的正确性。
选项A分析
在实际情况中,由于存在随机误差项,实际观测值 $Y$ 与OLS估计回归值 $\hat{Y}$ 通常是不相等的。即 $Y = \hat{Y}+\epsilon$,其中 $\epsilon$ 为随机误差项,一般情况下 $\epsilon\neq0$,所以 $\hat{Y} \neq Y$,选项A错误。
选项B分析
$\hat{Y}$ 是根据回归方程计算得到的估计值,它会随着样本数据的不同而变化,并不一定等于样本均值 $\overline{Y}$。所以选项B错误。
选项C分析
$\overline{\hat{Y}}$ 是 $\hat{Y}$ 的样本均值,$Y$ 是实际观测值,它们之间没有必然的相等关系。所以选项C错误。
选项D分析
设回归方程为 $\hat{Y}_i=\hat{\beta}_0+\hat{\beta}_1X_i$,其中 $\hat{\beta}_0$ 和 $\hat{\beta}_1$ 是OLS估计的回归系数。
- 首先求 $\overline{\hat{Y}}$:
- 根据样本均值的定义,$\overline{\hat{Y}}=\frac{1}{n}\sum_{i = 1}^{n}\hat{Y}_i$。
- 将 $\hat{Y}_i=\hat{\beta}_0+\hat{\beta}_1X_i$ 代入上式可得:$\overline{\hat{Y}}=\frac{1}{n}\sum_{i = 1}^{n}(\hat{\beta}_0+\hat{\beta}_1X_i)$。
- 根据求和的性质 $\sum_{i = 1}^{n}(a + b)=\sum_{i = 1}^{n}a+\sum_{i = 1}^{n}b$,则 $\overline{\hat{Y}}=\frac{1}{n}\left(\sum_{i = 1}^{n}\hat{\beta}_0+\sum_{i = 1}^{n}\hat{\beta}_1X_i\right)$。
- 因为 $\hat{\beta}_0$ 和 $\hat{\beta}_1$ 是常数,所以 $\sum_{i = 1}^{n}\hat{\beta}_0=n\hat{\beta}_0$,$\sum_{i = 1}^{n}\hat{\beta}_1X_i=\hat{\beta}_1\sum_{i = 1}^{n}X_i$,则 $\overline{\hat{Y}}=\hat{\beta}_0+\hat{\beta}_1\frac{1}{n}\sum_{_{i = 1}^{n}X_i=\hat{\beta}_0+\hat{\beta}_1\overline{X}$。
- 然后根据OLS估计的性质,在一元线性回归中,$\hat{\beta}_0=\overline{Y}-\hat{\beta}_1\overline{X}$。
- 将 $\hat{\beta}_0=\overline{Y}-\hat{\beta}_1\overline{X}$ 代入 $\overline{\hat{Y}}=\hat{\beta}_0+\hat{\beta}_1\overline{X}$ 可得:
- $\overline{\hat{Y}}=\overline{Y}-\hat{\beta}_1\overline{X}+\hat{\beta}_1\overline{X}=\overline{Y}$。
所以选项D正确。