【发布时间】:2021-07-12 14:12:49
【问题描述】:
网址 = https://www.amazon.com/gp/bestsellers/beauty/ref=zg_bs_nav_0
products=driver.find_elements_by_xpath('//div[@class="a-section a-spacing-none aok-relative"]')
for pro in products:
_rank=str(pro.find_element_by_xpath('//span[@class="zg-badge-text"]').text).replace("#", "")
_link=pro.find_element_by_xpath('//div[@class="a-section a-spacing-none aok-relative"]/span/a[@class="a-link-normal"]').get_attribute('href')
我得到了 50 个相同的产品价值。怎么可能我不知道。 我需要页面所有产品数据。为什么硒只给出第一个元素 50 次。
我正在使用最新版本的 Chrome 驱动器和 selenium。
我的输出:
[['https://www.amazon.com/essence-Princess-Effect-Mascara-Cruelty/dp/B00T0C9XRK/ref=zg_bs_beauty_1/137-1053715-3426412?_encoding=UTF8&psc=1&refRID=GVS76499NHPKKRPTDZTR', '1', 'Beauty & Personal Care'],
['https://www.amazon.com/essence-Princess-Effect-Mascara-Cruelty/dp/B00T0C9XRK/ref=zg_bs_beauty_1/137-1053715-3426412?_encoding=UTF8&psc=1&refRID=GVS76499NHPKKRPTDZTR', '1', 'Beauty & Personal Care'],
['https://www.amazon.com/essence-Princess-Effect-Mascara-Cruelty/dp/B00T0C9XRK/ref=zg_bs_beauty_1/137-1053715-3426412?_encoding=UTF8&psc=1&refRID=GVS76499NHPKKRPTDZTR', '1', 'Beauty & Personal Care']]
【问题讨论】:
-
我需要产品链接和排名。但是我得到了重复的值=。
标签: python python-3.x selenium selenium-webdriver web-scraping