【发布时间】:2016-07-03 11:43:49
【问题描述】:
我正在尝试学习使用 python 进行数据抓取,并且一直在使用 Requests 和 BeautifulSoup4 库。它适用于普通网站。但是,当我尝试从一些延迟后加载表数据的网站中获取一些数据时,我发现我得到了一个空表。一个例子是this webpage
我尝试过的脚本是相当常规的。
import requests
from bs4 import BeautifulSoup
response = requests.get("http://www.oddsportal.com/soccer/england/premier-league/everton-arsenal-tnWxil2o#over-under;2")
soup = BeautifulSoup(response.text, "html.parser")
content = soup.find('div', {'id': 'odds-data-portal'})
数据加载到页面中的表odds-data-portal 中,但代码没有给我。如何确保表格已加载数据并首先获取?
【问题讨论】:
-
表格(内容)可能是由 JavaScript 生成的,因此当你只是 HTTP GET 时无法“看到”。
标签: python python-3.x web-scraping beautifulsoup python-requests