【发布时间】:2012-03-09 17:13:19
【问题描述】:
我是 nokogiri 的新手,但看起来这将是我用来抓取网页的工具。我正在寻找网页上的特定字词。这些词是“有效”、“满足要求”和“不满足要求”。我正在使用 watir 来浏览网站。我目前有:
page = Nokogiri::HTML.parse(browser.html)
获取 html,但我不知道从哪里开始。
感谢您的帮助!
【问题讨论】:
-
您可以将通过 nokogiri 获得的文本存储在变量中,并针对您需要的关键字进行正则表达式匹配,即“有效”,...
-
如果单词位于标记元素中,您会发现它更容易,例如
<p id="status"></p>,你可以在这里搜索元素,然后通过.inner_text获取值。
标签: ruby parsing nokogiri watir