虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的来自自变量,通常取值为0或1。引入哑变量事度德阻预守相总可使线性回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。
例如,反映文化程度的虚拟变来自量可取为:1:本科学历;0:非本科学历
一般地,在虚拟变量的设置中:基360百科础类型、肯定类型取值为1;民才束比较斤岩过过殖西转类型,否定类型取值为0。
模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析敌市快革缺雷书毫设大置我国GDP的时间序列,必须考庆火代备称星明你新虑"**"因素对国车抓帝资善控复溶民经济的破坏性影响厚求寻,吧备很续值剔除不可比的"**"因维田就请印伯令设读到感素。
2、检验却区不同属性类型对因乃淋酷全慢故变量的作用,例如工资模型中的文化程罪兆去度、季座副调服项建事导缩节对销售额的影响。
3、提高模型的精度,相当于将不同属性的腊煮道芝样本合并,扩大了样赠套本容量(增加那角渐铁心程须工较了误差自由度,从而降低了误差方差)
虚拟来自变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:
(1)如果回归360百科模型有截距项
有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。
(2)如果回归模型无截距项,有m个体盼促特征,设置m个虚拟变量