【发布时间】:2020-09-21 10:33:22
【问题描述】:
伙计们,所以我有这个网站,我想抓取公司名称,那些是婚礼策划师,基本上,我必须逐个城市/州去获取 URL,然后我必须将它放在我制作的简单代码中朋友的帮助,现在问题实际上是当我尝试将多个URL放入字符串时它不起作用,让我分享一下:
import requests
from bs4 import BeautifulSoup as BS
for x in range(1,200):
url = 'https://www.theknot.com/marketplace/wedding-planners-suffolk-va?page='
r = requests.get(url+str(x))
soup = BS(r.text, 'html.parser')
#week = soup.select('.LinesEllipsis.vendor-name--55315.primaryBold--a3d1e.body1--24afd')
week = soup.find_all(class_='LinesEllipsis vendor-name--55315 primaryBold--a3d1e body1--24afd')
for item in week:
print(item.text)
for x in range(1,200):
url = 'https://www.theknot.com/marketplace/wedding-planners-plano-tx?page='
r = requests.get(url+str(x))
soup = BS(r.text, 'html.parser')
#week = soup.select('.LinesEllipsis.vendor-name--55315.primaryBold--a3d1e.body1--24afd')
week = soup.find_all(class_='LinesEllipsis vendor-name--55315 primaryBold--a3d1e body1--24afd')
for item in week:
print(item.text)
所以这背后的逻辑是,从Suffolk-VA 获取公司名称,然后从Plano-TX 获取公司名称,然后将它们合并在一起,这将是最后的练习。但是无论我在 Suffolk-VA 公司之后尝试输入什么,他都会将其删除并仅从 1 个链接提供公司名称(URL)......我被卡住了 -_-
我知道这是非常简单的东西,但我无法破解它哈哈。在我去医院之前,如果有人能帮上忙,那就太好了,我手术后,我要去参加一些关于python的课程。
【问题讨论】:
标签: python python-3.x web-scraping