如果SPSS变量在原始文件中不存在,则使用Python合并

时间:2016-09-29 14:39:12

标签: python merge spss

我有一个SPSS文件,我正在从中移除不需要的变量,但是如果它们不存在则希望从其他地方引入变量。所以,我正在寻找一些Python代码来进入我的语法 - 保留列表中的所有变量,如果第一个文件中不存在任何变量,则将它们合并到第二个文件中。 (Python新秀在这里..)

谢谢!

2 个答案:

答案 0 :(得分:2)

这是一个让你入门的计划:

DATA LIST FREE / ID A B C D E.
BEGIN DATA
1 11 12 13 14 15
END DATA.
DATASET NAME DS1.

DATA LIST FREE /  ID D E F G H.
BEGIN DATA
1 24 25 26 27 28
END DATA.
DATASET NAME DS2.

BEGIN PROGRAM PYTHON.
import spssaux, spss
spss.Submit("dataset activate ds1.")
ds1vars=[v.VariableName for v in spssaux.VariableDict()]
spss.Submit("dataset activate ds2.")
ds2vars=[v.VariableName for v in spssaux.VariableDict()]

extravars = [v for v in ds2vars if v not in ds1vars]

spss.Submit("""

DATASET ACTIVATE DS2.
ADD FILES FILE=* /KEEP=ID %s.
MATCH FILES FILE=DS1 /TABLE DS2 /BY ID.
DATASET NAME DS3.
DATASET ACTIVATE DS3.

""" % (" ".join(extravars) ) )

END PROGRAM PYTHON.

答案 1 :(得分:0)

如果只是match files而不管缺少哪些变量,table中只存在file中不存在且file中不存在的变量将添加到~/.Rprofile }。
请注意,如果两个文件中的文本变量名称相同但宽度不同,则会遇到问题。