【问题标题】:get data out between html tags在 html 标签之间获取数据
【发布时间】:2009-10-01 01:36:17
【问题描述】:

我有一些 HTML

    <body>
    <p id="errorMessage">System.Web.HttpException: Path '/DynamicData/DimOrganisations/List.aspx' was not found.</p>
    <p>Generated: Tue, 29 Sep 2009 18:04:18 GMT</p>

我想在我的 HTMl 中搜索标签

p id="errorMessage"

然后用html取出数据。所以运行一些东西来寻找标签并在开始和结束标签之间获取数据。所以到最后我得到:

System.Web.HttpException: Path '/DynamicData/DimOrganisations/List.aspx' was not found.

谁能帮忙。我正在使用 C# 2008

谢谢

马克

【问题讨论】:

    标签: c# html


    【解决方案1】:

    您可以使用HTML Agility Pack 来解析 HTML 并找到您需要的元素/属性。

    【讨论】:

    • +1:它是一个强大的库,使用解析器/DOM 是解决问题的最佳方式。
    【解决方案2】:

    您如何解决这个问题将取决于您希望解决方案的通用性。如果您正在检查的 HTML 是由您的应用程序创建的,并且您可以保证它的格式,那么您可能可以使用简单的正则表达式来解决问题。也就是说,如果你总是有:

    &lt;p id="errorMessage&gt;Error message goes here.&lt;/p&gt;

    然后,查找该模式的正则表达式非常易于编写、测试和维护。

    但是,如果您允许在错误消息中使用任意 HTML 标记,那么您将不得不使用更复杂的东西,例如 HTML 解析器。

    如果这是一个内部调试工具,我强烈建议您使用更简单的方法。为您的错误消息设置 HTML 格式,以便使用最简单的方法轻松解析。

    【讨论】:

      猜你喜欢
      • 2013-09-16
      • 2015-09-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-11-12
      • 2021-03-31
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多