Stata中的编码范围答案

【问题标题】：Coding ranges in StataStata中的编码范围
【发布时间】：2013-01-30 05:49:55
【问题描述】：

我得到了一个非常粗糙的数据集。一个数据集为我提供了每个 X 变量的代码（一个 4 位代码），然后是一个解释每个代码含义的文本文件。奇怪的是，一个代码可能意味着什么，或者一个范围可能意味着同样的事情。例如：

文本文件是这样的：

2300-2372 = New York
2520      = Chicago
2572      = Denver
4000-4099 = Austin
4100-4200 = San Diego

我想要一种简单的方法来对给定的 Stata 文件进行编码，而无需创建 100 行代码。因为我有超过 1000 个分类和大约一百万个观察值。

【问题讨论】：

标签： stata

【解决方案1】：

使用inrange:

gen austin = 0
replace austin = 1 if inrange(X, 4000,4099)

对于这里有一个代码的城市，然后使范围在同一点开始和停止

【讨论】：