题目

3.3 证明 hat(sigma)^2=(1)/(n-p-1)SSE 是误差项方差 sigma^2 的无偏估计。

3.3 证明 $\hat{\sigma}^{2}=\frac{1}{n-p-1}SSE$ 是误差项方差 $\sigma^{2}$ 的无偏估计。

题目解答

答案

在多元线性回归中，残差平方和 $SSE$ 定义为 $SSE = \sum_{i=1}^n e_i^2$，其中 $e_i$ 为残差。残差向量 $\mathbf{e} = (\mathbf{I} - \mathbf{H})\boldsymbol{\epsilon}$，$\mathbf{H}$ 为帽子矩阵。
利用期望和迹的性质，可得：
$E(SSE) = E(\mathbf{e}^T\mathbf{e}) = \sigma^2 \text{tr}(\mathbf{I} - \mathbf{H}) = \sigma^2 (n - p - 1)$
其中，$\text{tr}(\mathbf{I} - \mathbf{H}) = n - (p + 1)$。
令 $\hat{\sigma}^2 = \frac{1}{n - p - 1}SSE$，则：
$E(\hat{\sigma}^2) = \sigma^2$
结论： $\hat{\sigma}^2 = \frac{1}{n - p - 1}SSE$ 是误差项方差 $\sigma^2$ 的无偏估计。

$\boxed{\hat{\sigma}^2 = \frac{1}{n - p - 1}SSE}$

解析

本题考查多元线性回归回归中误差项方差无偏估计的证明，解题的关键在于利用残差向量与误差向量的关系，结合期望和迹的性质来推导残差平方和的期望，进而证明给定的估计估计量是误差项方差的无偏估计。

明确残差平方和的定义：**
在多元线性回归中，残差平方和 $SSE$ 定义为 $SSE = \sum_{i = 1}^{n}e_{i}^{2}$，其中 $e_{i}$ 为残差。用矩阵形式表示，残差向量 $\(\mathbf{e}$)与误差向量($\boldsymbol{\epsilon}$)的关系为 $\mathbf{e}=(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}})$，这里 $\mathbf{H}$ 为帽子矩阵。
将 $SSE$ 转化成为矩阵形式：
$SSE=\sum_{i = 1}^{n}e_{i}^{2}=\mathbf{e}^{T}\mathbf{e}$，所以 $E(SSE)=E(\mathbf{e}^{T}\mathbf{e})$。
利用期望和迹的性质计算 $E(\mathbf{e}^{T}\mathbf{e})$ 进行推导：
已知 $\mathbf{e}=(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}})$，则 $E(\mathbf{e}^{T}\mathbf{e})=E\left([(\mathbf{I}-\mathbf{H})\boldsymbol{\boldsymbol{\epsilon}\}]^{T}(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}\right)$。
根据矩阵转置的性质 $(\(\mathbf{AB}$)^{T}=\mathbf{B}^{T}\mathbf{A}^{T})，可得 $E\left([(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}}]^{T}(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}\right)=E\left(\boldsymbol{\epsilon}^{T}(\mathbf{I}-\mathbf{H})^{T}(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}\right)$。
因为 $\mathbf{H}$}^{T}=\mathbf{H})，所以 $E\left(\boldsymbol{\epsilon}^{T}(\mathbf{I}-\mathbf{H})^{T}(\mathbf{I}-\mathbf{H})\boldsymbol{\epsilon}\right)=E\left(\boldsymbol{\epsilon}^{T}(\mathbf{I}-\mathbf{H})^{2}\boldsymbol{\epsilon}\right)$。
又因为 $E(\boldsymbol{\epsilon}\boldsymbol{\epsilon}^{T})=\sigma^{2}\mathbf{I}$，根据期望和迹的性质 $E(\mathbf{e}^{T}\mathbf{e})=\text{tr}(E(\mathbf{e}\mathbf{e}^{T}))$)，则 $E(\mathbf{e}^{T}\mathbf{e})=\text{tr}(E\left((\mathbf{I}-\mathbf{H})\boldsymbol{\boldsymbol{\epsilon}\}\boldsymbol{\epsilon}^{T}(\mathbf{I}-\mathbf{H})^{T}\right))$。
将 $E(\boldsymbol{\boldsymbol{\epsilon}\}\boldsymbol{\epsilon}^{T})=\sigma^{2}\mathbf{I}$ 代入上式，得到 $E(\mathbf{e}^{T}\mathbf{e})=\text{tr}\left((\mathbf{I}-\mathbf{H})\sigma^{2}\mathbf{I}(\mathbf{I}-\mathbf{H})^{T}\right)=\sigma^{2}\text{tr}\left((\mathbf{I}-\mathbf{H})^{2}\right)$。
由于 $(\mathbf{I}-\mathbf{H})^{2}=\mathbf{I}-2\mathbf{H}+\mathbf{H}^{2}=\mathbf{I}-2\mathbf{H}+\mathbf{H}=\mathbf{I}-\mathbf{H}$（因为 $\mathbf{H}^{2}=\mathbf{H}$），所以 $E(\mathbf{e}^{T}\mathbf{e})=\sigma^{2}\text{tr}(\mathbf{I}-\mathbf{H})$。
计算 $\text{tr}(\mathbf{I}-\mathbf{H})$：
根据迹的性质 $\text{tr}(\mathbf{A}-\mathbf{H})=\text{tr}(\mathbf{I})-\text{tr}(\mathbf{H})$，其中 $\text{tr}(\mathbf{I}) = n$，$\text{tr}(\mathbf{H})=p + 1$（$p$ 为自变量个数，$1$ 为截距项），所以 $\text{tr}(\mathbf{I}-\mathbf{H})=n-(p + 1)$。
则 $E(SSE)=E(\mathbf{e}^{T}\mathbf{e})=\sigma^{2}\text{tr}(\mathbf{I}-\mathbf{H})=\sigma^{2}(n - p - 1)$。
证明 $\hat{\sigma}^{2}=\frac{1}{n - p - 1}SSE$ 是无偏估计：
令 $\hat{\sigma}^{2}=\frac{1}{n - p - 1}SSE$，对其求期望 $E(\hat{\sigma}^{2})=E\left(\frac{1}{n - p - 1}SSE\right)$。
因为 $\frac{1}{n - p - 1}$ 是常数，根据期望的性质 $E(cX)=cE(X)$（$c$ 为常数，$X$ 为随机变量），可得 $E(\hat{\sigma}^{2})=\frac{1}{n - p - 1}E(SSE)$。
将 $E(SSE)=\sigma^{2}(n - p - 1)$ 代入上式，得到 $E(\hat{\sigma}^{2})=\frac{1}{n - p - 1}\times\sigma^{2}(n - p - 1)=\sigma^{2}$。
根据无偏估计的定义，若 $E(\hat{\theta})=\theta$，则 $\hat{\theta}$ 是 $\theta$ 的无偏估计，所以 $\hat{\sigma}^{2}=\frac{1}{n - p - 1}SSE$ 是误差项方差 $\sigma^{2}$ 的无偏估计。