【发布时间】:2021-10-24 04:38:12
【问题描述】:
好吧,在下面的代码中,我尝试提取屏幕上显示的表格,以便能够选择状态不是已接受的行,我附上了我尝试使用的代码,但是出现的错误:
thead = driver.find_element_by_tag_name('thead')
columns = [th.text for th in thead.find_elements_by_tag_name('th')]
soup = BeautifulSoup(driver.page_source, 'html.parser')
tbody = soup.find('table')
data = []
for td in tbody.find_all('tr'):
row = [i.text for i in td.find_all('td')]
data.append(row)
df = pd.DataFrame(data=data, columns=columns)
df.to_excel("files/prueba.xlsx")
driver.quit()
print("Realizado con exito")
错误如下: enter image description here
我要提取信息以选择的表如下:enter image description here
如果有人建议另一种解决方案来检查 oc 的状态,然后选中这些框,那么欢迎提出建议。
【问题讨论】:
-
错误清楚地说明了问题:
columns有 13 个值,但data只有 3 个实际列。你需要调试你的代码来弄清楚为什么会出现这种差异。
标签: python pandas selenium web-scraping beautifulsoup