【问题标题】:Simple techniques to pool and save multiple imputed data in Stata在 Stata 中汇集和保存多个估算数据的简单技术
【发布时间】:2018-05-18 04:01:44
【问题描述】:

我在Stata中使用多重插补方法生成了每个变量(child035educ035)的5个系列数据。生成的数据按以下系列格式化。

  1. 我想知道最好的数据集以供我进一步分析。我无法从文献中获得明确的信息来汇集估算数据以生成干净的集合。根据 Stata 手册中的程序描述,我相信系列 #5 可能是最佳解决方案。

  2. 我阅读了 Stata 手册 (mi extract) 和许多关于如何在 Stata 中保存最佳数据集以导出到 Excel 的博客文章,但这些方法都不起作用。我尝试了widemlong 格式,使用了两种不同的方法[mi extract 5keep if m==5,后跟replace m=0],但无法获得干净的数据集。当我关注mi extract 5 时,我收到一条错误消息no; data in memory would be lost

    _1_educ035 _2_educ035 _3_educ035 _4_educ035_5_educ035 _1_child035 _2_child035 _3_child035 _4_child035 _5_child035

我有这两个问题:

  1. 有没有一种简单的方法来汇集数据并获得最佳集合 数据?最后一个估算集是最好的解决方案吗?或平均值 5系列?

  2. 你能告诉我在 Stata 中提取的简单代码吗? 以上格式生成的干净数据集有哪些?

【问题讨论】:

  • Welcome.Vist How to Ask.
  • 多重插补的目的不是为了得到最好的替代数据集。这更像是一个统计问题,因为您想要做的事情是可疑的。

标签: stata


【解决方案1】:

我不太清楚你到底在做什么。但是,如果您得到类似 data would be lost 的信息,您可以尝试使用 clear 选项或任何适合您的情况。将其包裹在 preserve ... restore 中,以确保您稍后返回原始数据。

【讨论】:

  • 感谢大家帮助我。澄清我的问题:我的 213 人数据集有 10 个变量,其中缺少一些观察结果。 Stata mi 插补命令为每个人生成了 20 组完整的数据。我想从 20s 中选择并导出第 15 组,作为原始完整数据集在另一个软件中进行分析。选择和提取第 15 个集合的 R 命令是 "completeData
  • 我通过以下试验和错误解决了这个问题。 1. 我将估算的数据保存在内存文件中为save Mydata。 2.我通过Stata代码mi extract 15提取了所需的集合(本例中为第15个集合)。 3. 我打开数据编辑器并检查完整的数据,没有缺失值。 4. 我通过“另存为”菜单将完整的数据集保存在我的 PC 文件夹中,并为文件命名。注意:统计专家建议使用所有估算的数据集进行分析,但使用一个完整的数据集可以更轻松地重复分析,尤其是导出到其他软件。谢谢。
猜你喜欢
  • 1970-01-01
  • 2012-04-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多