【发布时间】:2019-03-19 18:12:32
【问题描述】:
我有从 SQL 中提取的地址数据,现在已加载到 R 中。我正在尝试提取各个组件,即查询末尾的 ZIP-CODE(状态也很好)。我希望 ZIP-CODE 和 State 出现在新的单独列中。
主要问题是邮政编码有时是 5 位数,有时是 9。
两个示例行是:
Address_FULL
1234 NOWHERE ST WASHINGTON DC 20005
567 EVERYWHERE LN CHARLOTTE NC 22011-1203
我怀疑我需要某种正则表达式\\d{5} 表示法,或者在我不知道存在的 dplyr 中进行某种花哨的操作。
【问题讨论】:
-
预期输出是什么?
-
使用正则表达式解析地址时要非常小心。本文解释了使用正则表达式进行解析时可能出现的问题。 smartystreets.com/articles/…
标签: r regex dplyr street-address