【发布时间】:2020-05-13 02:38:44
【问题描述】:
网址:https://www.wunderground.com/history/daily/KLGA/date/2020-5-5
url='https://www.wunderground.com/history/daily/KLGA/date/2020-5-5'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Accept-Encoding': 'none',
'Accept-Language': 'en-US,en;q=0.8',
'Connection': 'keep-alive'}
response = requests.get(url, headers=headers)
【问题讨论】:
-
到目前为止你尝试了什么?
-
这正在被渲染,我找不到任何引用 XHR josn 或 html 元素中的数据的东西。也许从某个地方的 api 获取数据
-
说得太早了!我确实找到了一个 XHR,并将其添加为答案
-
大家好,谢谢。我应用了 soup = BeautifulSoup(response.text) 但无法获取汤中的表格信息。我不知道为什么。我是 HTML 的初学者。
标签: python web-scraping