【问题标题】:How to grab info from DC Metro site to create XML file?如何从 DC Metro 站点获取信息以创建 XML 文件?
【发布时间】:2012-01-10 04:22:28
【问题描述】:

我觉得这对大多数人来说可能是一个微不足道的问题,但我是新手,所以非常感谢任何帮助!

所以我需要从网站上获取所有 DC 地铁站的坐标。我做了一些搜索,我发现site with all the stations 为您提供了点击车站名称的选项,然后点击车站所在位置的shows a map。当您点击地图时,您将被定向到a google maps 页面,其中坐标显示在搜索框中。我还注意到 URL 也包含坐标。

根据我所做的研究,似乎可以解析包含所有车站的原始 DC 地铁网站的源代码,通过每个链接到车站,然后解析每个站点的源代码站的个人网站抓取站的坐标和名称。一旦检索到,就可以将其存储到 XML 文件中。我想让 XML 看起来像这样:

<stations>
   <station>
      <name>Ballston-MU</name>
      <lat>38.882071</lat>
      <long>-77.111845</long>
   </station>
   <station>
      <name>Addison Road</name>
      <lat>38.886713</lat>
      <long>-76.893592</long>
   ...
</stations>

我真的不喜欢使用哪种语言。我什至不确定哪一个会更容易。我已经使用 javascript 和 jquery 来完成项目的其余部分。但由于我只需要 XML 文件,我认为我使用什么语言来创建它并不重要。

对不起,我知道这是超长!!!

【问题讨论】:

  • 据我所知,他们确实有一个 API (developer.wmata.com/docs),所以似乎没有必要解析他们的网站源代码
  • 谢谢!!!这解决了我的问题 :D :D :D

标签: javascript xml parsing google-maps web-scraping


【解决方案1】:

以防万一有人想知道,我按照用户 thg435 所说的操作并使用了DC metro's own API。刚刚注册,获得了 API 密钥,并使用他们提供的 URL 来获取包含所有所需信息的 XML 文件! :)

这是 URL(必须插入您自己的自定义 API 密钥才能使其工作): http://api.wmata.com/StationPrediction.svc/GetPrediction/A10?api_key=YOUR_API_KEY

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-03-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-16
    相关资源
    最近更新 更多