【问题标题】:efficient way to geocode huge amount of twitter user location对大量 Twitter 用户位置进行地理编码的有效方法
【发布时间】:2015-06-13 13:19:16
【问题描述】:

我想每天对代表全世界城市、州或国家的大约 200 万个字符串进行地理编码。 这些字符串不是很干净,(例如,您必须区分“Paris,France”和“Paris,TX”,但您还必须使用法国城市对“Paris”进行地理编码!)这就是为什么我希望使用 GMaps API 或 OSM Nominatim API。

蛮力解决方案是将 OSM 数据转储到我的计算机上并在本地处理,但我希望我能找到更简单的方法。

显然,我可以减少要进行地理编码的字符串数量,存储结果不必查询两次字符串,但我仍然有数十万个字符串要进行地理编码......

谢谢!

【问题讨论】:

  • 如果 php 是您的服务器端,您可以在下一次地理编码请求之前至少 1 或 2 秒睡眠来欺骗它

标签: google-maps twitter geocoding openstreetmap


【解决方案1】:

为了遵守usage policy 在使用 OSM 的 Nominatim 实例时,您必须在每个请求之间等待 1 秒。对 100.000 个请求进行地理编码大约需要 28 小时,这对您来说是可行的。或者,您可以使用other Nominatim instances 之一(在检查他们的使用政策后!)或尝试在本地install

【讨论】:

    猜你喜欢
    • 2011-02-04
    • 2010-12-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多