【问题标题】:Firefox engine library火狐引擎库
【发布时间】:2010-11-28 17:15:33
【问题描述】:

我现在使用 AxWebBrowser 组件从网页中获取 DOM 并在每个元素上查找使用的样式。不幸的是,这不能完美运行,并且某些元素没有返回正确的数据。

我在考虑是否可以使用 firefox 的引擎?是否有一些我可以使用的 dll 库,导航到页面并抛出页面的 DOM?

【问题讨论】:

标签: .net firefox


【解决方案1】:

如果您只想要网页中的 DOM - 例如用于抓取目的,而不是用于显示 - 您可能会发现 Crowbar 项目很有用:

http://simile.mit.edu/wiki/Crowbar

【讨论】:

    【解决方案2】:

    您可以通过其他方式获取文档文本并解析 DOM - 例如HtmlAgilityPack

    【讨论】:

    • 我最大的要求是获得应用的CSS,你知道这是否可能吗? AxWebBrowser 的每个元素都有 currentStyle 属性,其中包含有关应用样式的信息 - 但在某些情况下它不起作用。
    • 如果你想使用标签的属性,AxWebBrowser 有很多错误。您可以尝试获取标签的 OuterHtml,其中包含正确的文本/html。您可以将此字符串传递给 HtmlAgilityPack(或其他解析器)并读取“类”和/或“样式”属性。如果要获取样式的具体值,则可能需要解析 CSS 文件并在其中搜索指定的类。但是 - AxWebBrowser 有几个隐藏的错误(它们不会引发任何异常,但结果/行为不正确):(.
    猜你喜欢
    • 2011-01-04
    • 2011-08-02
    • 2013-10-30
    • 2011-08-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多