【发布时间】:2014-07-25 01:15:06
【问题描述】:
我在解析文本字符串中的地址时遇到问题。通常的地址将是“@address token token token”或“@address token token /ntoken”。
string <- c("@address token token token", "@address token token /ntoken")
gsub("^\\.?@([a-z0-9_]{1,25})[^a-z0-9_]+.*$", "\\1", string)
正确解析的
[1] "address" "address"
然而,在某些情况下,地址将是字符串中的唯一标记,然后正则表达式将返回包含@的地址
string <- c("@address token token token", "@address token token /ntoken", "@address")
gsub("^\\.?@([a-z0-9_]{1,25})[^a-z0-9_]+.*$", "\\1", string)
# [1] "address" "address" "@address"
如何指示正则表达式也管理一个令牌唯一的情况?
【问题讨论】: