【问题标题】:HTMLAgilityPack - Get text thats not in a tagHTMLAgilityPack - 获取不在标签中的文本
【发布时间】:2013-12-20 08:25:19
【问题描述】:
<a href="/state/details"><span class="state">Queens</span> New York</a>

我只想要“纽约”。如果没有获得“女王”,我怎么能做到这一点?

【问题讨论】:

  • 如果解决方案有效,请接受它作为答案或投票。如果没有 - 写下它

标签: c# .net xpath web-scraping html-agility-pack


【解决方案1】:

我建议使用 XPath 从您的 HtmlAgilityPack.HtmlDocument doc 变量中检索您需要的信息:

    foreach (HtmlNode node in doc.DocumentNode.SelectNodes("/a/text()[last()]"))
    {
        Console.WriteLine(node.InnerText.Trim());
    }

这仅选择纽约

【讨论】:

    【解决方案2】:

    使用 HtmlAgilityPack 您可以按如下方式使用 LastChild:

    return (doc.DocumentNode.Descendants("a").FirstOrDefault().LastChild.InnerText.Trim())
    

    这将只返回“纽约”。

    【讨论】:

      猜你喜欢
      • 2013-12-25
      • 1970-01-01
      • 1970-01-01
      • 2011-11-09
      • 1970-01-01
      • 1970-01-01
      • 2012-12-28
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多