题目
5. 为了避免陷入虚拟变量陷阱,如果一个定性变量有 m 类,则要引入 m 个虚拟变量。A. 错误B. 正确
5. 为了避免陷入虚拟变量陷阱,如果一个定性变量有 m 类,则要引入 m 个虚拟变量。
A. 错误
B. 正确
题目解答
答案
B. 正确
解析
考查要点:本题主要考查对虚拟变量陷阱的理解,以及如何正确设置虚拟变量以避免多重共线性问题。
解题核心思路:
当定性变量有$m$个类别时,若引入$m$个虚拟变量,会导致模型中出现完全多重共线性(即虚拟变量陷阱)。为了避免这一问题,应引入$m-1$个虚拟变量,剩余一类作为基准组。
关键点:
- 虚拟变量陷阱的本质是因虚拟变量之间存在线性关系导致模型无法估计。
- 基准组的作用是通过省略一个类别,消除变量间的线性依赖。
题目解析:
题目中提到“引入$m$个虚拟变量”来避免陷阱,这一说法错误。
- 虚拟变量陷阱的形成:若定性变量有$m$类,引入$m$个虚拟变量时,所有变量的取值将满足$\sum_{i=1}^m D_i = 1$(每观测必属于某一类),导致变量间存在完全线性关系。
- 正确做法:引入$m-1$个虚拟变量,剩余一类通过所有虚拟变量取0隐含表示。例如,季节(春、夏、秋、冬)需设3个虚拟变量,冬季作为基准组。
结论:题目中的操作会导致陷阱,因此正确答案为A. 错误。