【问题标题】:Parsing text to find geographic names解析文本以查找地理名称
【发布时间】:2012-07-12 15:18:35
【问题描述】:

我想编写一个解析器,在大量文本中搜索一些城市名称或其他地理主题。比如Sydney,Tower Bridge,Munich...

我的想法是向本地数据库请求一些带有地理信息的单词(例如http://www.geonames.org/,我可以在那里下载一些城市信息),如果有命中,数据库会响应一些 lan 和 lon 坐标。单词必须以大写字母开头并且长度必须>2

但我认为性能很差。一篇文章包含 10 到 100 个单词。 有没有更好的方法来查找有关文本的地理信息?

也许有更好的数据库,包含更多的地理信息?

您好, 命运

【问题讨论】:

  • 试试看。 Java 中的解析速度非常快。您可能不会遇到问题
  • 困难的部分是找到您需要查找的单词作为列表。然后你可以分词,找出任何符合条件的词。

标签: java parsing gis


【解决方案1】:

您可能希望使用诸如Lucene 之类的库来索引文本文件,然后搜索列表中的每个城市。结果将为您提供文件名和术语的位置(带有周围的文本 sn-p)

【讨论】:

【解决方案2】:

也许可以尝试使用 google JSON API:Search for Baltimore MD

【讨论】:

  • jeah 当然,但我需要对每个单词都有自己的要求。这对性能来说非常糟糕。而且我认为每个 API_KEY/User 对谷歌 api 的请求是有限的
猜你喜欢
  • 2012-03-08
  • 2011-12-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-10-05
  • 1970-01-01
相关资源
最近更新 更多