【发布时间】:2014-10-22 23:31:28
【问题描述】:
试图从 URL 中提取域名。例如:
x <-"https://stackoverflow.com/questions/ask"
收件人:stackoverflow.com
我从这个问题中找到了以下正则表达式。 regex match main domain name。
regex <- "([0-9A-Za-z]{2,}\\[0-9A-Za-z]{2,3}\\[0-9A-Za-z]{2,3}|[0-9A-Za-z]{2,}\\[0-9A-Za-z]{2,3})$"
但是当我尝试使用 stringr 包中的 str_extract 时,R 似乎无法理解它。
x2 <- str_extract(x, regex)
【问题讨论】:
-
您需要非常具体地了解您认为的“域名”。请参阅我的答案下的 cmets。