【发布时间】:2021-05-11 04:31:10
【问题描述】:
我在尝试使用 urllib.request 和 BeautifulSoup 抓取 https://www.bet365.com/ 时遇到问题。
问题是,下面的代码没有得到页面上的所有信息,例如没有出现玩家的名字。也许是另一个框架或配置来提取信息?
我的代码是:
from bs4 import BeautifulSoup
import urllib.request
url = "https://www.bet365.com/"
try:
page = urllib.request.urlopen(url)
except:
print("An error occured.")
soup = BeautifulSoup(page, 'html.parser')
soup = str(soup)
【问题讨论】:
-
信息并不总是包含在初始 HTML 响应中。在浏览器上加载页面时,在初始加载后是否还有其他请求包含您需要的信息? (使用chrome之类的浏览器和开发者工具进行分析)
-
加载@FraggaMuffin 后没有其他请求,即使我在 Chrome 中使用元素检查器,我也可以找到我想要的所有信息。你知道任何可以利用这一点的工具吗?
标签: python web-scraping beautifulsoup scrapy screen-scraping