【发布时间】:2017-01-26 18:29:16
【问题描述】:
我有以下html内容
<html><head>
<title>Simple</title>
</head>
<body>
<div id="Content" style="padding: 5px;">
<p><a href="http://confluence:8080/download/attachments/8618175/Text.txt?version=1&modificationDate=1484637732181">Text.txt</a><br/>
<span class="image-wrap" style=""><img src="http://confluence:8080/download/attachments/8618175/add-button-blue-hi.png?version=1&modificationDate=1484562338796" style="border: 1px solid black" /></span><br/>
<span class="image-wrap" style=""><a class="confluence-thumbnail-link 300x200" href='http://confluence:8080/download/attachments/8618175/attachment.jpg'><img src="http://confluence:8080/download/thumbnails/8618175/attachment.jpg" style="border: 1px solid black" /></a></span></p>
</div>
</body></html>
这里我有两个<a> 标签。我需要 <a> 节点的 href 值,其中属性 'src' 是第二个 <a> 节点的值,即 \"http://confluence:8080/download/thumbnails/8618175/attachment.jpg\" 我有一个变量说字符串 x 包含这个值,我需要根据该值获取<a>节点的href。
现在我正在使用 "href\s*=\s*(?:\"(?[^\"]*)\"|(?\S+))" 但它给出了我是所有节点的 href 值。
【问题讨论】:
-
这确实是一个很好的案例来处理HtmlAgilityPack。使用 XPath 获取所有
src等于您的值的a标记,然后获取它们的 href 值。