题目
为了避免陷入虚拟变量陷阱,如果一个定性变量有m类,则要引入m个虚拟变量。( )A. 正确B. 错误
为了避免陷入虚拟变量陷阱,如果一个定性变量有m类,则要引入m个虚拟变量。( )
- A. 正确
- B. 错误
题目解答
答案
B
解析
考查要点:本题主要考查对虚拟变量陷阱的理解,即如何正确设定定性变量的虚拟变量个数以避免多重共线性问题。
解题核心思路:
当定性变量有$m$个类别时,若引入$m$个虚拟变量,会导致完全多重共线性(虚拟变量陷阱)。正确的做法是引入$m-1$个虚拟变量,用其中一个类别作为基准组。
破题关键点:
- 虚拟变量陷阱的本质是变量之间存在线性依赖关系。
- 基准组的作用:通过省略1个虚拟变量,将该类别作为参考标准,避免共线性。
题目解析:
题目中提到“引入$m$个虚拟变量”来避免陷阱,但这一做法本身会导致陷阱。具体分析如下:
-
虚拟变量的设定规则
- 定性变量有$m$类时,需设定$m-1$个虚拟变量。
- 例如:性别(男、女)需1个虚拟变量;季度(春、夏、秋、冬)需3个虚拟变量。
-
陷阱的形成原因
- 若引入$m$个虚拟变量,所有变量的列向量之和为1(全1向量),导致设计矩阵$X$的列向量线性相关。
- 回归模型无法唯一估计参数,计算时会因$X'X$矩阵奇异而失败。
-
正确做法
- 通过省略1个虚拟变量,确保各虚拟变量相互独立,基准组通过所有变量为0隐含表示。
结论:题目中的说法错误,正确答案为B。