【发布时间】:2012-05-17 20:28:06
【问题描述】:
我想从 HTML 代码中获取所有网站。问题是我有一个正则表达式,它接受所有 URL,但地址中需要有 www。我需要使用哪种正则表达式来获取内容中没有 www 的 URL?
更新:我使用的正则表达式是:
string anchorPattern =
@"(?<Protocol>\w+)://(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*'";
【问题讨论】:
-
必答题:你现在有什么正则表达式?
-
@AdamMihalcin:只要他只想提取 URL,就可以使用正则表达式。它是一个 HTML 文档这一事实并不重要,因为他并没有在例如内部寻找 url。 href 属性。