题目
对于模型y_i=b_0+b_1x_i+u_i,为了考虑'地区'因素(北方,南方),引入2个虚拟变量形成变截距模型,则会产生()。A. 自相关性B. 异方差性C. 完全多重共线性D. 不完全多重共线性
对于模型y_i=b_0+b_1x_i+u_i,为了考虑'地区'因素(北方,南方),引入2个虚拟变量形成变截距模型,则会产生()。
A. 自相关性
B. 异方差性
C. 完全多重共线性
D. 不完全多重共线性
题目解答
答案
C. 完全多重共线性
解析
步骤 1:引入虚拟变量
为了考虑“地区”因素(北方,南方),我们引入两个虚拟变量。假设虚拟变量D1表示北方,D2表示南方。如果观测值属于北方,则D1=1,D2=0;如果观测值属于南方,则D1=0,D2=1。如果模型中同时包含这两个虚拟变量,那么模型可以表示为:y_i=b_0+b_1x_i+b_2D1+b_3D2+u_i。
步骤 2:多重共线性
在引入两个虚拟变量后,模型中存在多重共线性。这是因为当D1=1时,D2=0;当D1=0时,D2=1。这意味着D1和D2之间存在完全线性关系,即D1+D2=1。这种关系会导致完全多重共线性。
步骤 3:选择虚拟变量
为了避免完全多重共线性,通常只引入一个虚拟变量。例如,只引入D1,表示北方,南方则用基准类别表示。此时模型可以表示为:y_i=b_0+b_1x_i+b_2D1+u_i。其中,b_0表示南方的截距,b_0+b_2表示北方的截距。
为了考虑“地区”因素(北方,南方),我们引入两个虚拟变量。假设虚拟变量D1表示北方,D2表示南方。如果观测值属于北方,则D1=1,D2=0;如果观测值属于南方,则D1=0,D2=1。如果模型中同时包含这两个虚拟变量,那么模型可以表示为:y_i=b_0+b_1x_i+b_2D1+b_3D2+u_i。
步骤 2:多重共线性
在引入两个虚拟变量后,模型中存在多重共线性。这是因为当D1=1时,D2=0;当D1=0时,D2=1。这意味着D1和D2之间存在完全线性关系,即D1+D2=1。这种关系会导致完全多重共线性。
步骤 3:选择虚拟变量
为了避免完全多重共线性,通常只引入一个虚拟变量。例如,只引入D1,表示北方,南方则用基准类别表示。此时模型可以表示为:y_i=b_0+b_1x_i+b_2D1+u_i。其中,b_0表示南方的截距,b_0+b_2表示北方的截距。