xiaomingzaixian

python抓取网页中的动态数据

一、概念

  网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的。所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器后动态生成的,而之前并没有的。在编写爬虫进行网页数据抓取的时候,经常会遇到这种需要动态加载数据的HTML网页,如果还是直接从网页上抓取那么将无法获得任何数据。

二、操作

  1.先进入网址如:https://dujia.qunar.com/

  2.在Chrome浏览器中,点击F12,打开Network中的XHR,我们来抓取对应的js文件来进行解析:

  3.向下拖拽或点击获取更多时,使得页面加载入更多的数据信息,从而我们可以抓取对应的报文。如点击“度假”

  4.查看XHR

  5.访问Request URL查看json信息:

  https://dujia.qunar.com/golfz/urlProxy/proxy.qunar?urlPath=http%3A%2F%2Fdiy.dujia.qunar.com%2Fapi%2Fdest.json&_=1501918232175

 

分类:

技术点:

相关文章:

  • 2022-12-23
  • 2021-09-09
  • 2021-12-16
  • 2021-11-09
  • 2021-09-09
  • 2021-12-01
猜你喜欢
  • 2022-12-23
  • 2021-11-21
  • 2021-12-20
  • 2021-11-27
  • 2021-10-23
  • 2021-11-09
相关资源
相似解决方案