【发布时间】:2013-05-27 13:25:18
【问题描述】:
通过该代码,我从 html 文档中提取了所有需要的文本
private void RunThroughSearch(string url)
{
private IWebDriver driver;
driver = new FirefoxDriver();
INavigation nav = driver.Navigate();
nav.GoToUrl(url);
var div = driver.FindElement(By.Id("results"));
var element = driver.FindElements(By.ClassName("sa_wr"));
}
虽然我需要细化提取文档的结果
Container
HEADER -> Title of a given block
Url -> Link to the relevant block
text -> body of a given block
/Container
正如您在我的代码中看到的,我能够获取文本部分的值 作为文本值,这很好,但如果我想要 容器的值是 HTML 而不是提取的文本?
<div class="container">
<div class="Header"> Title...</div>
<div class="Url"> www.example.co.il</div>
<div class="ResConent"> bla.. </div>
</div>
所以容器在一个页面中大约有 10 次 我需要提取它的 innerHtml 。
有什么想法吗? (使用硒)
【问题讨论】:
标签: c# html-parsing selenium-webdriver