【发布时间】:2019-07-03 12:36:35
【问题描述】:
为这个非常新手的问题道歉,但我才刚刚开始我的 Python 之旅,并开始学习网络抓取。
我编写了一些代码来抓取一个时尚网站并返回一些产品信息。我真正想做的是刮掉主类别页面并删除所有产品名称和价格。我认为我将需要使用 FOR 循环,并且我已经尝试了各种迭代,我在这个网站上发现了这些迭代,但我似乎无法让它工作。
我想提取页面上所有商品的产品名称和价格,以便导出。下面的代码可以很好地返回页面上的第一项,但我不确定如何添加循环来获取其余部分。
import requests
from bs4 import BeautifulSoup
url = 'https://www.riverisland.com/c/men/seasonal-offers?icid=mhp/winter-treats/m/seasonal-offers/cat'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
data_item = []
for item in name_box, price_box:
data_item.append()
name_box = soup.find('div', attrs={'class':'product__title ui-body-text'})
price_box = soup.find('div', attrs={'class':'product-price__headline-product-price__headline--sale'})
name = name_box.text.strip()
price = price_box.text.strip()
【问题讨论】:
-
能否更新一下关于您要抓取哪些信息以及发生什么类型的错误的问题?
-
抱歉,我已经试着说得更具体一点了
标签: python web-scraping beautifulsoup