【发布时间】:2019-08-09 18:46:48
【问题描述】:
大家早上好,
我尝试在这个网站上收集有关汽车的数据:https://www.caramigo.eu/
为此,我需要在主页的搜索栏上针对指定的位置和日期发起请求。这为我提供了一个这样的页面:https://www.caramigo.eu/be/fr/recherche?address=Belgique%2C+Wallonie%2C+Li%C3%A8ge%2C+4000%2C+Li%C3%A8ge&date_debut=22-03-2019&date_fin=23-03-2019
然后,借助我的 Web 浏览器的开发工具,我可以恢复 JSON 文件中的数据并将其抓取。问题是,每次我发起对新位置的请求时,JSON 文件都会发生变化,并且位于同一 URL (https://www.caramigo.eu/services/car)。
有没有人知道如何创建一个蜘蛛来启动请求、获取 JSON 文件并抓取它?或者我可以如何直接更改 API 上的数据以获取其他位置?
提前致谢!
【问题讨论】:
-
您的意见是什么?您是否有要抓取数据的特定位置,还是要获取所有数据?
-
嗯,我想要关于汽车特性、租金价格的数据,......我想搜索一下我国所有的城市中心,大约有 500 个官方城市。
标签: python json database scrapy web-crawler