【发布时间】:2017-02-09 10:18:13
【问题描述】:
所以我有一个包含街道地址的数据集,它们的格式非常不同。例如:
d <- c("street1234", "Street 423", "Long Street 12-14", "Road 18A", "Road 12 - 15", "Road 1/2")
据此,我想创建两列。 1. X:带有街道地址和 2. Y:带有数字+后面的所有内容。像这样:
X Y
Street 1234
Street 423
Long Street 12-14
Road 18A
Road 12 - 15
Road 1/2
到目前为止,我已经尝试了 strsplit 并在这里关注了一些类似的问题,例如:strsplit(d, split = "(?<=[a-zA-Z])(?=[0-9])", perl = T))。我似乎无法找到正确的正则表达式。
非常感谢任何帮助。提前谢谢!
【问题讨论】: