【发布时间】:2015-08-26 21:34:19
【问题描述】:
我想加入几个面板数据集。
这些数据集中的观察由一个 id 变量和一个标识观察时间的变量标识。 所有数据集都包含一些我需要的变量,一些我不需要的变量,而且从来没有相同的变量(不包括 id 和survey-time-variable)。
数据集很大,所以为了加快处理速度并减小最终数据集的大小,我想drop所有我不需要的变量。
这些变量存储在一个包含多列的 Excel 文件中。其中一列,比如 C2,包含我所有的变量名。
现在我相信我有两种可能的方法可以遵循,我按照我的喜好进行描述:
1) 将 Excel 文件中的变量名读入 Stata 中的全局变量,然后声明:
keep global varlist
这样只有我需要的变量应该被保留。
2) 使用 Excel 文件中的所有变量生成一个新的空数据集,然后
joinby id syear $varlist using dataset, update
无论如何,我需要将 excel 文件中的变量读出到全局变量中。 我意识到我可以通过从 Excel 复制并粘贴到 Stata 来做到这一点,但我想随着工作的进行,变量会发生一些变化,我想学习如何在 Stata 中正确编程。
【问题讨论】:
标签: excel variables import stata