题目
3.12 用表 3-10 的数据,建立GDP对x1和x2的回归。对得到的二元回归方程 hat (y)=-|||-.382+0.798(x)_(1)+2.001(x)_(2), 你能够合理地解释两个回归系数吗?如果现在不能给出合-|||-理的解释,不妨在学过第6章多重共线性后再来解释这个问题,在学过第7章岭回归-|||-后再来改进这个问题。-|||-表 3-10 GDP和三次产业数据 单位:亿元-|||-年 份 GDP 第一产业增加值x1 第二产业增加值x2 第三产业增加值x3-|||-1990 18 667.8 5 062.0 7 717.4 5888.4-|||-1991 21 781.5 5 342.2 9 102.2 7337.1-|||-1992 26 923.5 5866.6 11 699.5 9357.4-|||-1993 35 333.9 6 963.8 16 454.4 11 915.7-|||-1994 48 197.9 9 572.7 22 445.4 16 179.8-|||-1995 60 793.7 12 135.8 28 679.5 19 978.5-|||-1996 71 176.6 14015.4 33 835.0 23 326.2-|||-续表-|||-年 份 GDP 第一产业增加值x1 第二产业增加值x2 第三产业增加值x3-|||-1997 78 973.0 14 441.9 37 543.0 26 988.1-|||-1998 84 402.3 14 817.6 39 004.2 30 580.5-|||-1999 89 677.1 14 770.0 41 033.6 33 873.4-|||-2000 99 214.6 14 944.7 45 555.9 38 714.0-|||-2001 109 655.2 15 781.3 49 512.3 44 361.6-|||-2002 120 332.7 16 537.0 53 896.8 49 898.9-|||-2003 135 822.8 17 381.7 62 436.3 56004.7-|||-2004 159 878.3 21 412.7 73 904.3 64 561.3-|||-2005 184 937.4 22 420.0 87 598.1 74 919.3-|||-2006 216 314.4 24040.0 103 719.5 88 554.9-|||-2007 265 810.3 28 627.0 125 831.4 111 351.9-|||-2008 314 045.4 33 702.0 149003.4 131 340.0-|||-2009 340 902.8 35 226.0 157 638.8 148 038.0-|||-2010 401 512.8 40 533.6 187 383.2 173 596.0-|||-2011 473 104.0 47 486.2 220 412.8 205 205.0-|||-2012 518 942.1 52 373.6 235162.0 231 406.5

题目解答
答案

解析
考查要点:本题主要考查对多重共线性的理解及其对回归系数的影响。题目中三次产业增加值(x1、x2、x3)之和等于GDP,导致变量间存在完全多重共线性,使得回归系数估计结果失真。
解题核心思路:
- 识别变量间的线性关系:观察数据发现x1 + x2 + x3 = GDP,说明变量间存在严格的线性依赖关系。
- 分析共线性后果:完全多重共线性会导致回归模型无法唯一确定系数,出现不合理的结果(如符号错误、数值异常)。
- 结合经济意义判断:第一产业增加值(x1)通常随经济发展占比下降,其回归系数应为负,但结果为正且数值偏大,进一步验证共线性问题。
步骤1:发现变量间线性关系
从数据表中可观察到:
$\text{GDP} = x_1 + x_2 + x_3$
即三个产业增加值之和严格等于GDP,说明变量间存在完全多重共线性。
步骤2:分析共线性对回归的影响
在回归模型中,若包含截距项,则设计矩阵存在线性相关关系:
$1 \cdot \text{GDP} - x_1 - x_2 - x_3 = 0$
此时模型无法唯一估计回归系数,可能出现以下现象:
- 系数符号错误:例如x1系数为正,但实际经济中第一产业占比可能随GDP增长而下降,合理系数应为负。
- 系数数值不稳定:共线性导致系数对数据微小变化极度敏感,结果不可靠。
步骤3:结合具体结果判断
题目中x1回归系数为0.80,远高于其他变量系数(如x2、x3可能为负或较小),且经济意义不符,直接反映了共线性导致的模型失效。