【问题标题】:Coding ranges in StataStata中的编码范围
【发布时间】:2013-01-30 05:49:55
【问题描述】:

我得到了一个非常粗糙的数据集。一个数据集为我提供了每个 X 变量的代码(一个 4 位代码),然后是一个解释每个代码含义的文本文件。奇怪的是,一个代码可能意味着什么,或者一个范围可能意味着同样的事情。例如:

X
2321
2322
2341
2520
2572
4000
4001
4002
4100

文本文件是这样的:

2300-2372 = New York
2520      = Chicago
2572      = Denver
4000-4099 = Austin
4100-4200 = San Diego

我想要一种简单的方法来对给定的 Stata 文件进行编码,而无需创建 100 行代码。因为我有超过 1000 个分类和大约一百万个观察值。

【问题讨论】:

    标签: stata


    【解决方案1】:

    使用inrange:

    gen austin = 0
    replace austin = 1 if inrange(X, 4000,4099)
    

    对于这里有一个代码的城市,然后使范围在同一点开始和停止

    【讨论】:

    • gen austin = inrange(X, 4000,4099) 让您合二为一。但是你真的想要为每个地方设置一个单独的变量吗?
    • 另见并发线程stackoverflow.com/questions/14591130/… 了解将文本文件转换为do 文件的想法。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-09-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-03
    • 1970-01-01
    相关资源
    最近更新 更多