【发布时间】:2021-09-14 00:13:06
【问题描述】:
我想获取此页面上的所有产品:
nike.com.br/snkrs#estoque
我的python代码是这样的:
produtos = []
def aviso():
print("Started!")
request = requests.get("https://www.nike.com.br/snkrs#estoque")
soup = bs4(request.text, "html.parser")
links = soup.find_all("a", class_="btn", text="Comprar")
links_filtred = list(set(links))
for link in links_filtred:
if(produto not in produtos):
request = requests.get(f"{link['href']}")
soup = bs4(request.text, "html.parser")
produto = soup.find("div", class_="nome-preco-produto").get_text()
if(code_formated == ""):
code_formated = "\u200b"
print(f"Nome: {produto} Link: {link['href']}\n")
produtos.append(link["href"])
aviso()
伙计们,这段代码从页面获取产品,但不是昨天的全部,我怀疑内容是动态的,但是我怎样才能通过 request 和 beautifulsoup 获取它们?我不想使用 Selenium 或自动化库,我该怎么做?我不想更改我的代码,因为它快完成了,我该怎么做?
【问题讨论】:
-
你可以直接调用feed,循环
p参数,增加int(如1、2、3)等等。 -
知道了,我会应用它并查看结果,谢谢:)
-
@αԋɱҽԃ αмєяιcαη 我刚刚意识到这个提要页面没有我在问题中提到的网址中的所有内容:(
-
已经有了。从 1 到 5。
-
@αԋɱҽԃ αмєяιcαη 嗯,我明白了,它有效,但如果它有 6 或 4 页,我将如何找到?
标签: python python-3.x python-2.7 beautifulsoup