快速计算许多变量中缺失值的方法答案

【问题标题】：Quick way to count missing values in many variables快速计算许多变量中缺失值的方法
【发布时间】：2018-08-22 14:07:54
【问题描述】：

我创建了一个小程序来计算“无”的数量，因此缺少值。但问题是它非常耗时（在 6-7mn 左右为 1000 变量，这太多了，因为我正在处理更大的数据集）。

所以我正在寻找替代方案，也许有人可以在这里提供帮助。这是我的程序：

BEGIN PROGRAM.
import spss
vars=spss.GetVariableCount()

for i in range(vars):
    dataCursor=spss.Cursor([i])
    oneVar=dataCursor.fetchall()
    dataCursor.close()
    miss=str(oneVar)
    counter=miss.count('None')
    #print counter
print "done"
END PROGRAM.

我也尝试过替换：

counter=miss.count('None')

通过

counter=miss.find('None')

但这并没有改变任何东西。有人可以在这里帮助我吗？我用google看到了这个程序的帮助：

begin program.
import spssdata
majors = []
for case in spssdata.Spssdata('mq1'):
    major = case[0]
    if major not in majors:
        majors.append(major)
print majors
end program.

但我无法让它为所有变量运行。因为当我们有 'None' 时，它总是会列在该列表的第一位，我认为这可能有助于找到解决方案。

如果有人有任何想法，我将非常感激！

【问题讨论】：

标签： python spss

【解决方案1】：

SPSS 语法aggregate 命令可以轻松做到这一点：

aggregate ...... /nms1 to nms1000=nmiss(var1 to var1000).

【讨论】：