题目
关于虚拟变量,下列表述正确的有 A. 是对定性变量的数量化描述B. 取值为1和0C. 模型中不可以引入多类别的虚拟变量D. 取值为1和2
关于虚拟变量,下列表述正确的有
- A. 是对定性变量的数量化描述
- B. 取值为1和0
- C. 模型中不可以引入多类别的虚拟变量
- D. 取值为1和2
题目解答
答案
AB
解析
考查要点:本题主要考查对虚拟变量概念的理解,包括其定义、取值特点以及在模型中的应用限制。
解题核心思路:
- 虚拟变量的作用:将定性变量转化为可量化的形式,便于统计模型处理。
- 取值规则:通常取0和1,避免引入多重共线性。
- 多类别处理:需通过降维(如n类用n-1个虚拟变量)避免模型问题。
破题关键点:
- 明确虚拟变量的二元性(0/1)和降维原则。
- 区分正确表述与干扰项(如选项C的误导性表述)。
选项分析
A. 是对定性变量的数量化描述
正确。虚拟变量通过赋值(如0/1)将定性特征(如性别、职业)转化为数值形式,便于回归分析。
B. 取值为1和0
正确。虚拟变量的标准取值为二元形式,1表示存在某特征,0表示不存在。
C. 模型中不可以引入多类别的虚拟变量
错误。多类别可通过降维处理(如3类用2个虚拟变量)引入模型,而非完全禁止。
D. 取值为1和2
错误。若取值为连续整数(如1/2),会改变变量的二元性质,导致模型解释偏差。