【发布时间】:2012-07-12 15:18:35
【问题描述】:
我想编写一个解析器,在大量文本中搜索一些城市名称或其他地理主题。比如Sydney,Tower Bridge,Munich...
我的想法是向本地数据库请求一些带有地理信息的单词(例如http://www.geonames.org/,我可以在那里下载一些城市信息),如果有命中,数据库会响应一些 lan 和 lon 坐标。单词必须以大写字母开头并且长度必须>2
但我认为性能很差。一篇文章包含 10 到 100 个单词。 有没有更好的方法来查找有关文本的地理信息?
也许有更好的数据库,包含更多的地理信息?
您好, 命运
【问题讨论】:
-
试试看。 Java 中的解析速度非常快。您可能不会遇到问题
-
困难的部分是找到您需要查找的单词作为列表。然后你可以分词,找出任何符合条件的词。