如何在堆叠数据集中选择 SPSS 中的案例答案

【问题标题】：How to select cases in SPSS in a stacked data set如何在堆叠数据集中选择 SPSS 中的案例
【发布时间】：2014-09-17 19:26:13
【问题描述】：

我有一个非常大的（949,000 obs.）堆叠（长格式）数据集。我想根据一个变量中是否存在数据来选择案例，但保留该唯一 ID 的其他堆叠数据。这有意义吗？

你有什么想法吗？

【问题讨论】：

您能否描述一下您所说的“堆叠数据集”是什么意思？或者更好的是，举一个你的数据结构和预期结果的例子？
当然，数据结构的另一个术语称为长格式。因此，对于每个人，都有多个条目（行）。假设在时间 1，人 A 采取了一定的措施 (Y)，但即使有另外 12 次观察，也再也没有这样做过。我只想选择采取措施 Y 的个人的案例，但我需要保留该特定人员的其他观察结果，尽管行中没有 Y 的数据。
我的格式不支持，忽略此特定消息

【解决方案1】：

您当然可以在统计中做到这一点。使用 AGGREGATE 并将人员 ID 作为中断变量，例如，将平均值作为汇总统计量。选择将聚合统计信息添加到案例中。然后只选择那些没有丢失聚合的情况。

【讨论】：

【解决方案2】：

SPSS 是用于统计的应用程序包，而不是编程语言。我会使用 stackoverflow 系列的其他成员。

【讨论】：

1) 这不是答案，因此最好将其作为评论留下。 2）这在 CrossValidated 上是题外话，因为它纯粹是一个编程问题，所以这里是主题。 OP cross-posted 已关闭！