【发布时间】:2015-06-21 08:29:54
【问题描述】:
问题:
解析网站时,有些字符会导致 Mechanize 无法正确解析。
提出的解决方案
- 解析来自网站的响应以删除这些字符 在 mechanize 尝试解析它之前。
- 或者,在 Mechanize 解析 Web 后删除这些字符,然后让 Mechanize 重新解析它以获取链接、表单等...
问题
如何在解析之前访问网站响应?
或者,我以后怎么解析,然后让 Mechanize 重新加载?
谢谢!
【问题讨论】:
-
无法理解您的第二个问题。
-
我的想法是让 mechanize 下载网站并使用 page.body 访问它。然后在那里删除我需要的字符,然后要求页面重新加载/重新解析器本身,以便我可以再次访问表单和链接。
标签: html ruby parsing mechanize