【发布时间】:2017-02-01 15:54:26
【问题描述】:
我不确定如何使用正则表达式选择标题。我试过了
match(/<title>(.*) .*<\/title>/)[1]
但这不匹配任何东西。
This 是我要从中选择的响应正文。
尝试选择"title I need to select."
【问题讨论】:
-
用正则表达式解析 HTML 只会给开发者带来不幸的后果:stackoverflow.com/a/1732454/67392
-
“如果你有一小部分 HTML 页面,你想从其中抓取数据然后填充到数据库中,那么正则表达式可能工作得很好。”这似乎是我想要做的。所以可能没问题?
-
另外你会推荐做什么?
-
@user3579614 你对 JavaScript 有什么了解吗?它的语法相似,更适合抓取 HTML 页面。
-
是的,有点。我找到了 nokogiri,这似乎可以正确完成工作?
标签: ruby-on-rails ruby regex match