【发布时间】:2018-09-19 06:26:17
【问题描述】:
我正在尝试解析网站“https://ih.advfn.com/stock-market/NYSE/gen-electric-GE/stock-price”并从其董事会提取其最新消息。它受到 Cloud-flare 的 bot 保护。我正在使用 python 及其相关库,这就是我到目前为止所拥有的
from bs4 import BeautifulSoup as soup #parses/cuts the html
import cfscrape
import requests
url = 'https://ih.advfn.com/stock-market/NYSE/gen-electric-GE/stock-
price'
r=requests.get(url)
html = soup(r.text, "html.parser")
containers = html.find("div",{"id":"bbPosts"})
print(containers.text.strip())
我无法使用 html 解析器,因为该站点会检测并阻止我的脚本。 我的问题是: 如何解析网页以拉取表格数据?
我可以提一下,这是针对我正在学习的安全课程的。我不是出于恶意原因使用它。
【问题讨论】:
标签: python parsing web-scraping