【发布时间】:2022-01-23 18:52:47
【问题描述】:
我刚开始学习网络报废并尝试从https://www.ishares.com/us/products/268752/ishares-global-reit-etf 的“Holdings”表中提取数据
首先,我使用 pandas,但它返回空数据框。后来发现这个表是动态的,需要用到selenium。但话又说回来,它也给我返回了空数据框。有人可以帮我吗?真的很感激。
import pandas as pd
from selenium import webdriver
from bs4 import BeautifulSoup
# Instantiate options
options = webdriver.ChromeOptions()
options.headless = True
# Instantiate a webdriver
site = 'https://www.ishares.com/us/products/268752/ishares-global-reit-etf'
wd = webdriver.Chrome('chromedriver',options=options)
wd.get(site)
# Load the HTML page
html = wd.page_source
# Extract data with pandas
df = pd.read_html(html)
table = df[6]
【问题讨论】:
标签: pandas dataframe selenium web-scraping webdriverwait