【发布时间】:2014-03-07 22:53:24
【问题描述】:
我有一个包含两个相同列的 csv 文件:
X,X
0,0
1,1
2,2
我想将它导入 Stata 13,但它不喜欢导入第二个 X(因为名称相同):
. import delimited "filename.csv"
X already defined
Error creating variables
r(109);
有没有简单的方法强制导入?
我不想指定要导入的行。实际数据集有 100 多个变量,重复变量分布在各处。
同样,我不想手动重命名变量。
如果 Stata 想要删除或重命名第二个 X,我很好。
作为背景,这个 csv 文件是由一些草率的 SQL 代码生成的。重复的变量正是我用于连接的变量。我可以清理 SQL 代码或预清理(使用例如 Python),但我希望让 Stata 强制导入。
【问题讨论】:
-
你不能在Excel中打开数据文件并更改变量名吗?
-
这个特殊的 csv 有超过一百万行,我相信不会在 Excel 中加载。但是——总的来说——我宁愿不这样做……即使是在可能的情况下。
标签: stata