【发布时间】:2018-10-09 17:42:08
【问题描述】:
我正在尝试抓取网页,当我使用 request.get() 获取页面时,我没有获得整个 html 代码。当我执行代码时,正文中有一个空的 div 标签。我不确定为什么会这样。谁能帮我解决这个问题?
from bs4 import BeautifulSoup
import smtplib
import requests
r = requests.get("https://ethermine.org/miners/8153516Db85e201abD29A0FfCcd9cCeF4aFF33c6/dashboard")
data = r.text
print(data)
soup = BeautifulSoup(data,'html.parser')
mydivs = soup.find("div", attrs={"class": "card-body"})
h5 = mydivs.findChild()
span= h5.findChild()
print (span.text)
【问题讨论】:
-
您能否更具体地说明您要抓取哪些信息?
-
去网页可以看到算力。这就是我想要的。
-
所有信息似乎都可以通过他们的 api 获得:ethermine.org/api/pool
标签: python web-scraping beautifulsoup