【问题标题】:Quick way to count missing values in many variables快速计算许多变量中缺失值的方法
【发布时间】:2018-08-22 14:07:54
【问题描述】:

我创建了一个小程序来计算“无”的数量,因此缺少值。但问题是它非常耗时(在 6-7mn 左右为 1000 变量,这太多了,因为我正在处理更大的数据集)。

所以我正在寻找替代方案,也许有人可以在这里提供帮助。这是我的程序:

BEGIN PROGRAM.
import spss
vars=spss.GetVariableCount()

for i in range(vars):
    dataCursor=spss.Cursor([i])
    oneVar=dataCursor.fetchall()
    dataCursor.close()
    miss=str(oneVar)
    counter=miss.count('None')
    #print counter
print "done"
END PROGRAM.

我也尝试过替换:

counter=miss.count('None')

通过

counter=miss.find('None')

但这并没有改变任何东西。有人可以在这里帮助我吗?我用google看到了这个程序的帮助:

begin program.
import spssdata
majors = []
for case in spssdata.Spssdata('mq1'):
    major = case[0]
    if major not in majors:
        majors.append(major)
print majors
end program.

但我无法让它为所有变量运行。因为当我们有 'None' 时,它总是会列在该列表的第一位,我认为这可能有助于找到解决方案。

如果有人有任何想法,我将非常感激!

【问题讨论】:

    标签: python spss


    【解决方案1】:

    SPSS 语法aggregate 命令可以轻松做到这一点:

    aggregate ...... /nms1 to nms1000=nmiss(var1 to var1000).
    

    【讨论】:

      猜你喜欢
      • 2014-09-13
      • 2018-09-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-07-22
      • 1970-01-01
      • 2017-03-10
      • 1970-01-01
      相关资源
      最近更新 更多