【问题标题】:Selenium parsing amazon (Python)Selenium 解析亚马逊(Python)
【发布时间】:2020-12-27 17:55:20
【问题描述】:

您好,我正在尝试解析文本中的所有星级评论(4、1、4、2 等)

driver.get('https://www.amazon.com/gp/new-releases/kitchen/ref=zg_bs_tab_t_bsnr')

elements=WebDriverWait(driver,20).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,".a-icon-alt")))
for i in elements:
    i = i.get_attribute("innerHTML")
    i= i.split(' ')[0]
    list3.append(i)

我想解析评论星,如果评论星不存在而不是打印一些东西。

【问题讨论】:

  • 代码有什么问题?描述一下你的代码在做什么?
  • 我的代码解析页面上的所有评论,我想知道评论是否不存在,而不是不存在评论将一些文本添加到列表中
  • 我提供了代码。您可以尝试对其进行一些更改

标签: python selenium parsing


【解决方案1】:

试试:

from bs4 import BeautifulSoup as bs
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
import time

driver = webdriver.Chrome(ChromeDriverManager().install())
driver.set_window_size(1024, 600)
driver.maximize_window()
url = "https://www.amazon.com/gp/new-releases/kitchen/ref=zg_bs_tab_t_bsnr"

driver.get(url)
time.sleep(2)

soup=bs(driver.page_source,'html.parser')

for card in soup.findAll('span', {'class': 'aok-inline-block zg-item'}):
    elem = card.find('span', {'class': 'a-icon-alt'})
    if elem:
        print(elem.text.split()[0])
    else: print("no")

【讨论】:

    猜你喜欢
    • 2021-04-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-10-01
    • 2017-04-04
    相关资源
    最近更新 更多