【发布时间】:2016-02-11 02:22:39
【问题描述】:
我一直在尝试自学如何抓取和抓取不同的网站。我对抓取/抓取有很好的感觉,但仅限于主要使用 HTML 的网站。现在我正在使用这个链接https://intel.taleo.net/careersection/10000/jobsearch.ftl
我正在使用 Perl (with mechanize) 来执行以下任务:我想编写一个爬虫/爬虫来单击左侧的“美国”复选框(过滤结果)然后收集所有作业的标题.但是,我找不到使用 Perl 导航到此单选按钮的方法。有人可以让我开始吗? (示例代码会很有帮助)。
【问题讨论】:
-
您是否考虑过使用像PhantomJS 这样的无头浏览器?它的设置更多,但它支持完整的 Javascript。然后,您可以挂钩页面的事件并在页面加载/显示表单/获取结果后执行 JS 代码。
标签: javascript perl web-scraping web-crawler www-mechanize