【发布时间】:2021-08-03 09:00:23
【问题描述】:
所以,我正在尝试使用 BeautifulSoup4 解析网页中的表格,它能够获取网页并解析内容,但是当我继续寻找要放入 pandas 数据框的表格时,我得到了属性错误:“NONETYPE”对象没有属性“Find_all”
我在另一个网页上尝试了相同的过程,它能够正常工作,我只是想弄清楚我在这里做错了什么,一个工作,另一个不工作。
#Imports
import pandas as pd
import numpy as np
from bs4 import BeautifulSoup
import requests
#Load data
url = 'https://gisopendata.siouxfalls.org/datasets/7b0407feca3e4f47bfe54559b9c1dd5d_13/data'
#Get request
web_data = requests.get(url)
#Parse Content
soup = BeautifulSoup(web_data.text, 'lxml')
#print(soup.prettify())
table = soup.find('table', {'class':'table table-striped table-bordered table-hover'})
headers = []
for i in table.find_all('th'):
title = i.text.strip()
headers.append(title)
【问题讨论】:
-
数据从 POST 请求动态拉到不同的端点。
-
这能回答你的问题吗? pandas read_html ValueError: No tables found
标签: python pandas web-scraping beautifulsoup