粒子统计 哑变量在SPSS中更简便、高效的设置方法

 

哑变量在SPSS中更简便、高效的设置方法...



昨天关于哑变量的文章发出来后,有朋友问我:SPSS中可以运用逻辑函数设置哑变量么?然后我就试了一下,发现比昨天介绍的重新编码方法更加简便!

因此本着循证医学不断更新证据的思路,今天来补充一下。

话不多说,直接开讲。还是昨天的粒子,用x1、x2、x3区分血型A、B、AB和O。不记得的朋友可以再回看一下。这次我们要用到的菜单是 转化 --> 计算变量(如图1)。



图1
我们先来设置x1:是否A型。在弹出的对话框中(如图2),“目标变量”中输入“x1”。然后在“数字表达式”框中直接输入我们的逻辑条件:血型=1(就是这么直白……如果血型是按A、B、AB、O这样的文字输入,则需要加一对引号,写为:血型="A"),点击确定,x1就设置好了。


图2
我稍微讲一下这一步在干嘛,有兴趣的朋友可以看一下。

一般地,我们知道数学表达式包括加、减、乘、除、平方、取对数……在计算机代码中,往往还有一类称为“逻辑运算”的东西~ 即判断所给的条件是否为“真”,然后可以将这个判断结果赋值给指定变量。

其实这里就是做了一次逻辑运算,x1=(血型=1)的含义就是将“血型=1”这个逻辑判断的结果赋值给x1。显然“血型=1”只有两种结果:如果血型是A型,则为“真”(SPSS中用1表示),如果血型不是A型,则为“假”(SPSS中以0表示)。于是,我们就得到了所需要的x1。

x2和x3的设置方法是一样的,只是逻辑条件分别改为 血型=2 和 血型=3。最终的结果和昨天我们用重新编码的方法是一模一样的(如图3)。

(顺道说一句,个人觉得这种算法从效率上来说,可能优于昨天介绍的重新编码法,当数据量大的时候估计会出现程序运行时间上的差异。)


图3
好了,今天的Update就到这了。欢迎大家向我多提建议~
长按下图并识别即可关注“蚂蚁数据”


欢迎转发,请注明出处


    关注 蚂蚁数据


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册