【问题标题】:In C#.net, how can I parse HTML?在 C#.net 中,如何解析 HTML?
【发布时间】:2011-12-18 10:09:47
【问题描述】:

我有一个网络浏览器控件。我将它导航到某个地址。当它加载时,我只想从此代码中选择 url。是否可以像xml一样处理html?如果可能的话,我也可以使用其他 DOM 属性。任何 xml 之类的成分容器对象可以将 html 传递给它? 谢谢。

【问题讨论】:

标签: c# controls browser


【解决方案1】:

听起来你需要使用HTML agility pack

另请参阅其他堆栈溢出问题:

C# Is there a LINQ to HTML, or some other good .Net HTML manipulation API?

【讨论】:

    【解决方案2】:

    是的,您可以使用 MSHTML 来导航 DOM。您需要在项目中添加对Microsoft.mshtml 的引用。使用它获取文档中所有链接的示例如下:

    private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
    {
        HtmlDocument doc = webBrowser1.Document;
    
        foreach (HtmlElement element in doc.Links)
        {
            HTMLAnchorElement link = (HTMLAnchorElement) element.DomElement;
            Debug.WriteLine(link.href);
        }
    }
    

    【讨论】:

      猜你喜欢
      • 2013-06-28
      • 1970-01-01
      • 2011-08-29
      • 1970-01-01
      • 1970-01-01
      • 2012-10-11
      • 1970-01-01
      • 1970-01-01
      • 2012-09-12
      相关资源
      最近更新 更多