【发布时间】:2018-05-09 18:11:07
【问题描述】:
我是 Scrapy 新手,我需要抓取一个页面,但在抓取要抓取的页面时遇到问题。
不填写页面上的任何字段,直接点击“PESQUISAR”(翻译:搜索)按钮,我需要将下面显示的所有页面都刮掉。
看来我的问题出在页面 javascript 中。我从未使用过 javascript。
from scrapy import Spider
from selenium import webdriver
from scrapy.selector import Selector
class CarfSpider(Spider):
name = 'carf'
allowed_domains = ['example.com']
def start_requests(self):
self.driver = webdriver.Chrome('/Users/Desktop/chromedriver')
self.driver.get('example.com')
sel = Selector(text=self.driver.page_source)
carf = sel.xpath('//*[@id="botaoPesquisarCarf"]')
我的主要困难是跟踪这个页面。因此,如果有人可以帮助我解决这个问题,我将不胜感激。
抱歉英语不好,希望你能理解
【问题讨论】:
标签: python-3.x selenium scrapy selenium-chromedriver