Question

我有一个SPSS文件，我正在从中移除不需要的变量，但是如果它们不存在则希望从其他地方引入变量。所以，我正在寻找一些Python代码来进入我的语法 - 保留列表中的所有变量，如果第一个文件中不存在任何变量，则将它们合并到第二个文件中。（Python新秀在这里..）

谢谢！

Answer 1

这是一个让你入门的计划：

DATA LIST FREE / ID A B C D E.
BEGIN DATA
1 11 12 13 14 15
END DATA.
DATASET NAME DS1.

DATA LIST FREE /  ID D E F G H.
BEGIN DATA
1 24 25 26 27 28
END DATA.
DATASET NAME DS2.

BEGIN PROGRAM PYTHON.
import spssaux, spss
spss.Submit("dataset activate ds1.")
ds1vars=[v.VariableName for v in spssaux.VariableDict()]
spss.Submit("dataset activate ds2.")
ds2vars=[v.VariableName for v in spssaux.VariableDict()]

extravars = [v for v in ds2vars if v not in ds1vars]

spss.Submit("""

DATASET ACTIVATE DS2.
ADD FILES FILE=* /KEEP=ID %s.
MATCH FILES FILE=DS1 /TABLE DS2 /BY ID.
DATASET NAME DS3.
DATASET ACTIVATE DS3.

""" % (" ".join(extravars) ) )

END PROGRAM PYTHON.

Answer 2

如果只是match files而不管缺少哪些变量，table中只存在file中不存在且file中不存在的变量将添加到~/.Rprofile }。
请注意，如果两个文件中的文本变量名称相同但宽度不同，则会遇到问题。

如果SPSS变量在原始文件中不存在，则使用Python合并

2 个答案: