【发布时间】:2012-01-10 04:22:28
【问题描述】:
我觉得这对大多数人来说可能是一个微不足道的问题,但我是新手,所以非常感谢任何帮助!
所以我需要从网站上获取所有 DC 地铁站的坐标。我做了一些搜索,我发现site with all the stations 为您提供了点击车站名称的选项,然后点击车站所在位置的shows a map。当您点击地图时,您将被定向到a google maps 页面,其中坐标显示在搜索框中。我还注意到 URL 也包含坐标。
根据我所做的研究,似乎可以解析包含所有车站的原始 DC 地铁网站的源代码,通过每个链接到车站,然后解析每个站点的源代码站的个人网站抓取站的坐标和名称。一旦检索到,就可以将其存储到 XML 文件中。我想让 XML 看起来像这样:
<stations>
<station>
<name>Ballston-MU</name>
<lat>38.882071</lat>
<long>-77.111845</long>
</station>
<station>
<name>Addison Road</name>
<lat>38.886713</lat>
<long>-76.893592</long>
...
</stations>
我真的不喜欢使用哪种语言。我什至不确定哪一个会更容易。我已经使用 javascript 和 jquery 来完成项目的其余部分。但由于我只需要 XML 文件,我认为我使用什么语言来创建它并不重要。
对不起,我知道这是超长!!!
【问题讨论】:
-
据我所知,他们确实有一个 API (developer.wmata.com/docs),所以似乎没有必要解析他们的网站源代码
-
谢谢!!!这解决了我的问题 :D :D :D
标签: javascript xml parsing google-maps web-scraping