tulintao

python爬虫处理POST request payload请求

 

最近在采集某网站的时候发现是通过post请求来请求数据的,使用的数据格式是request payload,这个和之前看到过的常见的POST请求不同(Form data),这个时候在使用Form data的请求方式来提交时,就无法请求到真实数据了。

 

 

 Http请求中Form data和request payload的区别:其实这两种都是ajax中常见的两种传参数的形式

 

Form data

get请求的时候我们通常直接在url中以key=value的形式

post请求,表单参数都是在请求体中的,也就是将key=value从url中剥离了出来

 

request payload

要是使用的是原声的ajax post请求的话,那么在chrome中的开发者模式下会看到单独的request payload中的参互展示出来

在请求的content-Type中是application/json;charset=UTF=8,而在请求表单的参数在request payload中

 

两者之间的区别

如果一个请求的content-Type被设置成application/x-www-form-urlencoded,那么这个Post请求会被认为是Http Post请求,那么请求的主体将会以一个标准的键值对和&的querystring形式出现,这种方式是HTML表单的默认设置,所以在过去这种方式更加常见

其他形式的POST请求,是放到request payload中(现在为了方便阅读,使用了json进行序列化),所以请求的content-Type设置成了application/json;charset=UTF-8或者是不指定

 

python中使用requests模块来请求post payload模块

        payloadData = {
            \'initPage\': \'false\',
            \'pageNum\': \'1\',
            \'pageSize\': \'20\',
            \'supplierCateId\': "-1",
            \'queryType\': "pro"
        }
        payloadData[\'pageNum\'] = str(jb)
        # 请求头设置
        payloadHeader = {
            \'Host\': \'a300010770.casmart.com.cn\',
            \'Content-Type\': \'application/json\',
        }
        r = requests.post(postUrl, data=json.dumps(payloadData), headers=payloadHeader).text    

分类:

技术点:

相关文章:

  • 2021-08-23
  • 2018-04-11
  • 2021-12-05
  • 2022-02-27
  • 2022-12-23
  • 2022-01-08
  • 2021-11-10
猜你喜欢
  • 2021-07-07
  • 2021-12-21
  • 2022-12-23
  • 2021-09-23
  • 2021-04-07
  • 2021-07-30
相关资源
相似解决方案