【发布时间】:2018-06-30 13:12:57
【问题描述】:
我正在尝试下载此网站上的数据 https://coinmunity.co/ ...为了以后在 Python 或 Pandas 中操作它 我曾尝试通过 Requests 直接对 Pandas 执行此操作,但没有成功,使用以下代码:
res = requests.get("https://coinmunity.co/")
soup = BeautifulSoup(res.content, 'lxml')
table = soup.find_all('table')[0]
dfm = pd.read_html(str(table), header = 0)
dfm = dfm[0].dropna(axis=0, thresh=4)
dfm.head()
在我尝试的大多数事情中,我只能访问标题中的信息,这似乎是代码在此页面中看到的唯一表格。
看到这不起作用,我尝试使用 Requests 和 BeautifulSoup 进行相同的抓取,但它也不起作用。这是我的代码:
import requests
from bs4 import BeautifulSoup
res = requests.get("https://coinmunity.co/")
soup = BeautifulSoup(res.content, 'lxml')
#table = soup.find_all('table')[0]
#table = soup.find_all('div', {'class':'inner-container'})
#table = soup.find_all('tbody', {'class':'_ngcontent-c0'})
#table = soup.find_all('table')[0].findAll('tr')
#table = soup.find_all('table')[0].find('tbody')#.find_all('tbody _ngcontent-c3=""')
table = soup.find_all('p', {'class':'stats change positiveSubscribers'})
你可以在评论的行中看到,我尝试了所有的东西,但没有任何效果。 有什么方法可以轻松下载该表以在 Pandas/Python 上以最整洁、更简单和最快的方式使用它? 谢谢
【问题讨论】:
标签: python pandas beautifulsoup python-requests