【发布时间】:2016-09-07 07:24:25
【问题描述】:
有一个包含 3 个变量的数据集 - ID、Wage 和 Year ,这是一个不平衡的面板。有2个问题:
- 我想删除 所有 此类 ID 上的数据,其中有 Year 没有观察。很快,我想将我的不平衡面板转换为平衡,删除每个造成这种“不平衡”的 id。
例如,如果一个 ID = 1 的人没有在 Wage 中报告他的 Wage strong>Year = 2010(因此没有观察到 Year = 2010 和 ID = 1),我想删除 ID = 1 的所有数据。
这似乎是一个热门问题,但我在 Google 和 StackOverflow 上找到的只是 Stata 的多种解决方案,而 SPSS 则没有。
更新:我设法使用 COUNTIF Excel 函数解决了这个问题。我创建了一个变量来计算某些 ID 出现在数据集中的次数,并保留此函数 = 年数的观测值,从而删除不平衡的 ID 。但是,我仍然迫切需要解决第二个问题:)
- 第二个问题与第一个问题几乎相同 - 我想删除 所有 此类 ID 的数据,其中有一个 年他们报告工资 = 0
例如,如果一个 ID = 1 的人报告 Wage = 0 在 Year = 2010,我想删除 ID = 1 的所有数据。
如果 SPSS 中有一个填充命令可以平衡不平衡面板和缺失值,那么第二个问题的解决方案似乎同时也是第一个问题的解决方案。
更新 2:我也在 Wage 和 ID 上使用 COUNTIFS 解决了这个问题。 Excel无所不能,赞美Excel。
【问题讨论】:
-
当三行简单的语法会自动完成所有事情时,为什么在 Excel 中进行所有这些肮脏的工作?对于某些工作,Excel 可能提供比 SPSS 更好的解决方案,但这绝对不是其中之一。
标签: statistics missing-data spss