【发布时间】:2010-09-22 22:48:13
【问题描述】:
我已将整个网页的 html 保存为字符串,现在我想从链接中获取“href”值,最好能够稍后将它们保存为不同的字符串。最好的方法是什么?
我尝试将字符串另存为 .xml 文档并使用 XPathDocument 导航器对其进行解析,但是(令人惊讶的是)它不能很好地导航非真正的 xml 文档。
正则表达式是实现我想要实现的目标的最佳方法吗?
【问题讨论】:
标签: c# html xml html-content-extraction