【发布时间】:2020-11-17 08:19:23
【问题描述】:
我正在尝试从网页中提取 url(链接),我使用“find_element_by_css_selector”来获取我想要的项目。这个项目有一个网址。如何提取此网址。
我试过了:
prod_item = browser.find_elements_by_css_selector('div.col-lg-2')
print(prod_item[0].get_attribute('href'))
但我得到“无”作为输出。我很想使用 css_selector,因为页面上有许多类似的项目,而 'div.col-lg-2' 是它们共同的属性。 如何解决这个问题并获取链接?
这里是完整的代码:
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common.exceptions import TimeoutException
url = 'https://auctionmaxx.com/Browse?page=0'
browser = webdriver.Firefox()
browser.get(url)
prod_item = WebDriverWait(browser, 20).until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR, "div.col-lg-2[href]")))
print(prod_item[4].get_attribute('href'))
【问题讨论】:
标签: python selenium web-scraping automation webautomation