【发布时间】:2013-07-20 20:41:59
【问题描述】:
我正在使用 Nokogiri 拉取 <h1> 和 <title> 标签,
但我无法获得这些:
<meta name="description" content="I design and develop websites and applications.">
<meta name="keywords" content="web designer,web developer">
我有这个代码:
url = 'https://en.wikipedia.org/wiki/Emma_Watson'
page = Nokogiri::HTML(open(url))
puts page.css('title')[0].text puts page.css('h1')[0].text
puts page.css('description')
puts META DESCRIPTION
puts META KEYWORDS
我查看了文档并没有找到任何东西。我会使用正则表达式来执行此操作吗?
谢谢。
【问题讨论】:
-
给出完整的html..你的需求不清楚..
-
澄清一下:Nokogiri 不会爬任何东西。它只做解析。您的代码与 OpenURI 和 Nokogiri 等 gem 一起进行爬取。
标签: ruby html-parsing nokogiri