【发布时间】:2019-03-06 01:47:21
【问题描述】:
我正在尝试从该网站获取整个表格:https://br.investing.com/commodities/aluminum-historical-data
但是当我发送这段代码时:
with requests.Session() as s:
r = s.post('https://br.investing.com/commodities/aluminum-historical-data',
headers={"curr_id": "49768","smlID": "300586","header": "Alumínio Futuros Dados Históricos",
'User-Agent': 'Mozilla/5.0', 'st_date': '01/01/2017','end_date': '29/09/2018',
'interval_sec': 'Daily','sort_col': 'date','sort_ord': 'DESC','action': 'historical_data'})
bs2 = BeautifulSoup(r.text,'lxml')
tb = bs2.find('table',{"id":"curr_table"})
它只返回表格的一部分,而不是我刚刚过滤的整个日期。
我确实看到了下面的帖子页面:
谁能帮我得到我刚刚过滤的整个表格?
【问题讨论】:
-
如果您实际上没有提交任何帖子数据,为什么还要使用
POST?另外,如果您只执行一项操作,为什么还要使用会话? -
因为我尝试了没有会话并得到了相同的结果。然后我开始尝试一切
-
你从哪里得到这些标头值?
-
在我发布的照片中
-
那些不是标题,而是表单数据。你明白它怎么说“表单数据”了吗?
标签: python post web-scraping beautifulsoup python-requests