【问题标题】:Glassdoor scraping using Selenium使用 Selenium 刮玻璃门
【发布时间】:2021-06-29 08:49:15
【问题描述】:

我正在尝试使用此处给出的代码抓取 Glassdoor
https://github.com/PlayingNumbers/ds_salary_proj/blob/master/glassdoor_scraper.py
执行代码时,没有错误,网站打开,但没有任何反应。我认为他们已经更改了网站上的标签。我已经尝试更改标签,但它仍然有效。
这是sn-p的代码:

def get_jobs(keyword, num_jobs, verbose, path, slp_time):

    options = webdriver.ChromeOptions()
    driver = webdriver.Chrome(executable_path=path, options=options)
    driver.set_window_size(1120, 1000)
    url = 'https://www.glassdoor.com/Job/jobs.htm?sc.keyword="' + keyword + '"&locT=C&locId=1147401&locKeyword=San%20Francisco,%20CA&jobType=all&fromAge=-1&minSalary=0&includeNoSalaryJobs=true&radius=100&cityId=-1&minRating=0.0&industryId=-1&sgocId=-1&seniorityType=all&companyId=-1&employerSizes=0&applicationType=0&remoteWorkType=0'
    driver.get(url)
    jobs = []

    while len(jobs) < num_jobs:  
        time.sleep(slp_time)
        try:
            driver.find_element_by_class_name("selected").click()
        except ElementClickInterceptedException:
            pass

        time.sleep(.1)

        try:
            driver.find_element_by_css_selector('[alt="Close"]').click() 
            print(' x out worked')
        except NoSuchElementException:
            print('x out failed')
            pass

您可以在上面给出的链接中找到整个代码。
任何帮助将不胜感激!

【问题讨论】:

  • keyword 的值是多少?
  • driver.find_element_by_class_nam("selected").click(),我认为您缺少名称中的 e
  • @JeremyKahan 我在此处复制代码时发生的错误。它也不能使用正确的拼写
  • @cruisepandey 关键字是要搜索的职位名称。在我的代码中是“数据科学家”
  • @cruisepandey 它是 5

标签: python-3.x selenium selenium-chromedriver


【解决方案1】:

你能检查一下生成的网址吗

url = 'https://www.glassdoor.com/Job/jobs.htm?sc.keyword="' + keyword + '"&locT=C&locId=1147401&locKeyword=San%20Francisco,%20CA&jobType=all&fromAge=-1&minSalary=0&includeNoSalaryJobs=true&radius=100&cityId=-1&minRating=0.0&industryId=-1&sgocId=-1&seniorityType=all&companyId=-1&employerSizes=0&applicationType=0&remoteWorkType=0'

如果页面中显示结果,则手动验证

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-01-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-23
    • 1970-01-01
    • 2010-12-31
    • 1970-01-01
    相关资源
    最近更新 更多