商品价格和商品供给数据P(元)2 8 7 5 1 4 8 2 S(件)15 41 32 9 28 43 17 40 sum s^2=1025, sum p^2=55.9, sum ps=255.4。其中,小写字母表示离差(观察值减去均值)。(1)用OLS法估计线性回归方程E(S) = beta _1+ beta _2 P。(2)计算widehat beta _1, widehat beta _2的标准差。(3)检验假设:价格影响供给。(4)求beta _1的置信度为95%的置信区间。你对置信区间有何评论
商品价格和商品供给数据P(元)2 8 7 5 1 4 8 2 S(件)15 41 32 9 28 43 17 40 \sum s^2=1025, \sum p^2=55.9, \sum ps=255.4。其中,小写字母表示离差(观察值减去均值)。(1)用OLS法估计线性回归方程E(S) = \beta _1+ \beta _2 P。(2)计算\widehat \beta _1, \widehat \beta _2的标准差。(3)检验假设:价格影响供给。(4)求\beta _1的置信度为95%的置信区间。你对置信区间有何评论
题目解答
答案
(1) 用OLS法估计线性回归方程E(S) = \beta _1+ \beta _2 P。
首先,计算样本的均值:\bar{s}=24.125和\bar{p}=4.25
然后,计算离差平方和,并根据最小二乘法的原理计算出 \widehat{\beta}_1 和 \widehat{\beta}_2。
利用矩阵公式:
X = \begin{bmatrix} 1 & p_1 \ 1 & p_2 \ \vdots & \vdots \ 1 & p_n \end{bmatrix},
Y = \begin{bmatrix} s_1 \ s_2 \ \vdots \ s_n \end{bmatrix},
B = (X^TX)^{-1}X^TY
其中,n为观测数据的数量,p_i和s_i分别表示第i个商品价格和供给量。
代入数据可得:
X^TX = \begin{bmatrix} n & \sum_{i=1}^{n}p_i \ \sum_{i=1}^{n}p_i & \sum_{i=1}^{n}p_i^2 \end{bmatrix}
= \begin{bmatrix} 8 & 34 \ 34 & 170.9 \end{bmatrix}
(X^TX)^{-1} = \begin{bmatrix} 0.2125 & -0.025 \ -0.025 & 0.003125 \end{bmatrix}
X^TY = \begin{bmatrix} \sum_{i=1}^{n}s_i \ \sum_{i=1}^{n}p_is_i \end{bmatrix}
= \begin{bmatrix} 193 \ 912.4 \end{bmatrix}
因此,OLS估计的线性回归方程为:
E(S) = \widehat{\beta}_1 + \widehat{\beta}_2 P
其中,\widehat{\beta}_1 = 24.875 和 \widehat{\beta}_2 = 5.396。
所以,估计的线性回归方程为:
E(S) = 24.875 + 5.396P
(2) 计算 \widehat{\beta}_1 和 \widehat{\beta}_2 的标准差。
OLS估计的 \widehat{\beta}_1 和 \widehat{\beta}_2 的标准差如下:
SE(\widehat{\beta}1) = \sqrt{\frac{\sum{i=1}^{n}(s_i - \widehat{s_i})^2}{n-2}\left[\frac{1}{n} + \frac{\bar{p}^2}{\sum_{i=1}^{n}(p_i-\bar{p})^2}\right]} = 5.349
SE(\widehat{\beta}2) = \sqrt{\frac{\sum{i=1}^{n}(s_i - \widehat{s_i})^2}{n-2}\left[\frac{1}{\sum_{i=1}^{n}(p_i-\bar{p})^2}\right]} = 1.131
其中,\widehat{s_i}是根据估计的线性回归方程计算出第i个商品的供给量的估计值。
(3) 检验假设:价格影响供给。
使用t检验进行假设检验,即:
H_0: \beta_2 = 0(价格不影响供给)
H_1: \beta_2 \neq 0(价格影响供给)
根据OLS的结果,可以计算t统计量为:
t = \frac{\widehat{\beta}_2}{SE(\widehat{\beta}_2)} = \frac{5.396}{1.131} = 4.778
自由度df=n-2=6,置信水平为0.05时,双尾t分布的临界值为t_{0.025}(6)=2.447。
因为t>t_{0.025}(6),所以拒绝原假设,认为价格对供给有显著的影响。
(4) 求 \beta_1 的置信度为95%的置信区间,并进行评论。
利用t分布的临界值和标准误差来计算置信区间。在这个例子中,自由度df=n-2=6,置信水平为0.05时,双尾t分布的临界值为t_{0.025}(6)=2.447,而\widehat{\beta}_1=24.875和SE(\widehat{\beta}_1)=5.349。
因此,\beta_1的95%置信区间为:
\widehat{\beta}1 \pm t{0.025}(n-2) \times SE(\widehat{\beta}_1)
= 24.875 \pm 2.447 \times 5.349
= [11.76, 38.99]
根据计算结果,我们可以得出有95%的置信度认为真实的 \beta_1 值在11.76到38.99之间。
对置信区间的评论:置信区间是一个区间估计,表明在相同的抽样条件下,这个区间在一定置信水平下包含了参数的真实值。对于本题而言,我们可以有95%的置信度认为真实的\beta_1 落在了11.76到38.99之间。此外,置信区间的宽度反映了数据的不确定性,即样本大小越小,置信区间就越大;测量误差越大,置信区间也越大。
解析
- 考查要点:本题主要考查线性回归模型的OLS估计、参数标准误计算、假设检验以及置信区间构建。
- 解题思路:
- (1) 利用OLS公式计算回归系数,需掌握矩阵运算或协方差/方差法。
- (2) 标准误计算需结合残差平方和与协方差矩阵。
- (3) 通过t检验判断价格对供给的影响,需构造t统计量并比较临界值。
- (4) 置信区间需结合t分布临界值与标准误,需理解区间估计的意义。
第(1)题:OLS估计回归方程
计算样本均值
- 供给量均值 $\bar{S} = \frac{15+41+32+9+28+43+17+40}{8} = 24.125$
- 价格均值 $\bar{P} = \frac{2+8+7+5+1+4+8+2}{8} = 4.25$
构造矩阵并求逆
$X^TX = \begin{bmatrix} 8 & 34 \\ 34 & 170.9 \end{bmatrix}, \quad (X^TX)^{-1} = \begin{bmatrix} 0.2125 & -0.025 \\ -0.025 & 0.003125 \end{bmatrix}$
计算回归系数
$B = (X^TX)^{-1}X^TY = \begin{bmatrix} 24.875 \\ 5.396 \end{bmatrix}$
第(2)题:计算标准差
残差平方和
$\sum (S_i - \hat{S}_i)^2 = \sum S_i^2 - \hat{\beta}_1 \sum S_i - \hat{\beta}_2 \sum PS = 1025 - 24.875 \times 193 - 5.396 \times 255.4 = 102.4$
标准误公式
$SE(\hat{\beta}_1) = \sqrt{\frac{102.4}{6} \left( \frac{1}{8} + \frac{4.25^2}{170.9} \right)} \approx 5.349 \\ SE(\hat{\beta}_2) = \sqrt{\frac{102.4}{6} \times \frac{1}{170.9}} \approx 1.131$
第(3)题:假设检验
构造t统计量
$t = \frac{\hat{\beta}_2}{SE(\hat{\beta}_2)} = \frac{5.396}{1.131} \approx 4.778$
比较临界值
自由度 $df = 8 - 2 = 6$,双尾临界值 $t_{0.025}(6) = 2.447$。因 $4.778 > 2.447$,拒绝原假设,价格显著影响供给。
第(4)题:置信区间
计算置信区间
$\hat{\beta}_1 \pm t_{0.025}(6) \times SE(\hat{\beta}_1) = 24.875 \pm 2.447 \times 5.349 \approx [11.76, 38.99]$
评论
- 区间意义:有95%的把握认为 $\beta_1$ 真值在 $[11.76, 38.99]$ 内。
- 区间宽度:宽度反映估计的不确定性,样本量小或误差大时区间更宽。