有个需求爬取知乎文章,正好记录下爬取过程以及出现问题并解决方法
我是在没有登录的情况下爬取文章的

本文仅供研究与学习使用
知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。
来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。
查阅了网上有关文章,仅有x-zse-86 2.0版本的解密方法,现今已不适用,加上之前写的文章中有提及该解密方法,所以写一篇最新的,供大家研究与学习。

1.F12进入源码分析

Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)

2.响应json内容

Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)

https://www.zhihu.com/api/v4/search_v3?t=general&q=探店&correction=1&offset=20&limit=20&filter_fields=&lc_idx=20&show_all_topics=0&search_hash_id=7d9f263f8c4370bb21917e1edf6543da&vertical_info=0%2C1%2C1%2C0%2C0%2C0%2C0%2C0%2C0%2C1

3.断点调试

Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)

Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)

4.md5参数加密

不难发现明文是 headers 里的 x-zse-93 + url + cookie.d_c0
知乎貌似一直都是采用 md5 加密方式进行数据加密的,直接上去测就好了。
在终端输入:r.default(d)
Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)
运行结果:
Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)

相关文章:

  • 2021-06-23
  • 2022-12-23
  • 2022-02-08
  • 2022-12-23
  • 2021-10-27
  • 2022-12-23
  • 2022-12-23
  • 2021-08-13
猜你喜欢
  • 2021-08-27
  • 2021-12-11
  • 2021-08-31
  • 2022-03-04
  • 2021-11-18
  • 2022-12-23
相关资源
相似解决方案