【发布时间】:2021-09-30 12:35:33
【问题描述】:
电子邮件地址是被动生成的,即使没有 api 请求,选择器也无法找到它。 我已经做了两年多的网络抓取,这个问题时不时出现,主要是我通过加载一个带有硒的页面并解析响应来解决这个问题,但这次我必须坚持使用scrapy(没有飞溅)。
我注意到,一旦我获取 scrapy shell 中的链接并查看回复,我可以看到电子邮件,但选择器无法找到电子邮件。
到目前为止,我已经能够找到生成电子邮件的 javascript 请求,但我不知道如何使用 scrapy 对其进行逆向工程。
这是指向类似示例网站之一的链接。任何帮助表示赞赏
谢谢
【问题讨论】:
标签: python python-3.x web-scraping scrapy