【发布时间】:2017-02-08 16:21:09
【问题描述】:
我正在尝试从标签中提取 URL,但是,我得到的不是https://website.com/-id1,而是标签链接文本。这是我的代码:
string text="<a style=\"font - weight: bold; \" href=\"https://website.com/-id1\">MyLink</a>";
string parsed = Regex.Replace(text, " <[^>] + href =\"([^\"]+)\"[^>]*>", "$1 " );
parsed = Regex.Replace(parsed, "<[^>]+>", "");
Console.WriteLine(parsed);
我得到的结果是 MyLink,这不是我想要的。我想要类似的东西
https://website.com/-id1
任何帮助或链接将不胜感激。
【问题讨论】:
-
@rkun 您不是在解析,而是在替换。您不应该使用
.Match来捕获 URL,而不是尝试删除 在 URL 之外 的任何内容吗?例如.Match(text,""href\\s*=\\s*\".*?\"")