【问题标题】:Where's the source of this webpage?这个网页的来源在哪里?
【发布时间】:2020-07-14 01:42:41
【问题描述】:

我刚刚开始学习 Python,并在空闲时间参加了一些在线课程。

我正在尝试查找该网站的数据源,每天统计从机场出发的航班,并最终构建航班与日期图。

花了两周时间调查页面源,但找不到 json 源。请好心人告诉我json源在哪里?谢谢!

https://www.changiairport.com/en/flights/departures.html

【问题讨论】:

  • 作为评论,这通常不是堆栈溢出的工作方式。通常,您希望以对可能偶然遇到类似问题的其他人有所帮助的方式提出问题。您编写此内容的方式仅针对您的特定情况非常特殊,并且总体上限制了它对社区的有用性。

标签: python json scrape


【解决方案1】:

https://www.changiairport.com/cag-web/flights/departures?lang=en&callback=JSON_CALLBACK&date=today

你去。这将为您提供今天的航班时刻表。日期参数也可能是其他东西,但我不知道选项是什么。任何正常的 get 请求都应该可以工作,似乎可以公开访问。

您只需右键单击并转到“检查”,然后点击“网络”选项卡,然后浏览不同的请求。

请注意:
只是为了记录,这被称为刮,它通常是合法的 灰色区域,只要您没有过度使用它或 从中获利,您可能不会遇到任何麻烦,但是 如果您打算这样做,请确保您已获得公司的许可 对这样的开放 API 进行大量调用。这通常违反他们的服务条款,但作为非强制条款,他们只会在您成为滋扰者时使用。

【讨论】:

  • 谢谢山姆。回首往事,我意识到我也可以在 Network 下找到这个链接,只是我需要在加载页面之前调出 DevTools,以便显示数据源。
  • 你知道我怎样才能知道数据是否仅限于“明天”、“今天”和“昨天”,或者我可以指定一个具体的日期,例如2020 年 6 月 1 日?刚学刮,希望不亏本就好。
  • @bitterjam 不知道。您可以尝试使用标准 UTC 格式的日期。
  • @bitterjam 如果这个答案对你有帮助,请将其标记为正确:)
  • @bitterjam,作为提出问题的人,您可以单击按钮将答案标记为正确,这会提高我在网站上的声誉。 i.stack.imgur.com/OGwTL.png
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2013-11-02
  • 2011-03-23
  • 2011-09-04
  • 1970-01-01
  • 1970-01-01
  • 2017-06-04
  • 2021-11-14
相关资源
最近更新 更多