【发布时间】:2011-08-13 00:49:39
【问题描述】:
我熟悉 BeautifulSoup 和 urllib2 从网页中抓取数据。但是,如果在返回我要抓取的结果之前需要在页面中输入参数怎么办?
我正在尝试使用此网站获取两个地址之间的地理距离:http://www.freemaptools.com/how-far-is-it-between.htm
我希望能够进入该页面,输入两个地址,单击“显示”,然后提取“乌鸦飞的距离”和“陆路运输的距离”值并将它们保存到字典中。
有没有办法使用 Python 将数据输入到网页中?
【问题讨论】:
-
这不是回答你的问题,而是你的问题。我使用了一个名为 HttpFox 的 Firefox 扩展来计算网站为了计算距离做了什么,结果证明它使用了 Google Maps API。您可以免费使用它;请参阅:code.google.com/apis/maps/documentation/directions。例如,在 Linux 上的 shell 提示符下执行以下命令以获取 JSON 方向: curl "maps.googleapis.com/maps/api/directions/…"