【发布时间】:2020-11-03 04:59:51
【问题描述】:
我对 Python 和 Web-Scraping 非常陌生。我正在尝试访问此网页上所有表格中的数据,但我不确定我的代码为什么不起作用。也许与 JavaScript 和 python 无法读取它有关。我的代码是:
from urllib.request import urlopen
from bs4 import BeautifulSoup
import requests
headers = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36"}
res = requests.get("https://www.mcmaster.com/cam-lock-fittings/material~aluminum/", headers=headers)
soup = BeautifulSoup(res.text, 'lxml')
item_containers = soup.findAll("div", {"class":"ItmTblCntnr PrsnttnTbl"})
print(len(item_containers))
任何帮助将不胜感激!谢谢!
【问题讨论】:
-
它是 javascript 渲染的,因此您不会使用请求获取它。使用
selenium刮
标签: javascript python web-scraping beautifulsoup