【问题标题】:How to select cases in SPSS in a stacked data set如何在堆叠数据集中选择 SPSS 中的案例
【发布时间】:2014-09-17 19:26:13
【问题描述】:

我有一个非常大的(949,000 obs.)堆叠(长格式)数据集。我想根据一个变量中是否存在数据来选择案例,但保留该唯一 ID 的其他堆叠数据。这有意义吗?

你有什么想法吗?

【问题讨论】:

  • 您能否描述一下您所说的“堆叠数据集”是什么意思?或者更好的是,举一个你的数据结构和预期结果的例子?
  • 当然,数据结构的另一个术语称为长格式。因此,对于每个人,都有多个条目(行)。假设在时间 1,人 A 采取了一定的措施 (Y),但即使有另外 12 次观察,也再也没有这样做过。我只想选择采取措施 Y 的个人的案例,但我需要保留该特定人员的其他观察结果,尽管行中没有 Y 的数据。
  • 我的格式不支持,忽略此特定消息

标签: spss stacked select-case


【解决方案1】:

您当然可以在统计中做到这一点。使用 AGGREGATE 并将人员 ID 作为中断变量,例如,将平均值作为汇总统计量。选择将聚合统计信息添加到案例中。然后只选择那些没有丢失聚合的情况。

【讨论】:

    【解决方案2】:

    SPSS 是用于统计的应用程序包,而不是编程语言。我会使用 stackoverflow 系列的其他成员。

    尝试交叉验证 (https://stats.stackexchange.com/)

    【讨论】:

    • 1) 这不是答案,因此最好将其作为评论留下。 2)这在 CrossValidated 上是题外话,因为它纯粹是一个编程问题,所以这里是主题。 OP cross-posted 已关闭!
    猜你喜欢
    • 1970-01-01
    • 2016-12-28
    • 1970-01-01
    • 1970-01-01
    • 2014-05-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-22
    相关资源
    最近更新 更多