【问题标题】:Data storage for query用于查询的数据存储
【发布时间】:2012-11-11 13:44:11
【问题描述】:
我正在尝试解析 RSS 提要以查找对国家/地区的引用。目前我正在使用 Python,但我认为这个问题与语言无关(理论上)。
假设我有三个列表(所有相关的)
- 国家 - 名词(即英格兰、挪威、法国)
- 国家 - 形容词(即英语、挪威语、法语)
- 城市(即伦敦、纽卡斯尔、伯明翰)
我的目标是首先解析这些字符串的提要。
例如,如果找到“London”,则国家将是“England”,如果找到“Norwegian”,则将是“Norway”等。
处理这些数据的最佳方法是什么?会是 jason 并全力以赴创建嵌套字典吗?套?还是某种类型的数据库?
目前这仅适用于本地计算机。
【问题讨论】:
标签:
python
language-agnostic
【解决方案1】:
这是一个很有争议的问题。可以有多种解决方案。如果我是你,我会在 Mongodb 中创建一个小型数据库,其中包含三个这样的表
- 国家:
列:id、名称
- 国家-adj:
列:id、name、country_id
- 城市:
列:id、name、country_id
那么简单的查询就会得到你想要的结果。
【解决方案2】:
我建议将 3 个数据列表合并到一个字典中,将名称映射到国家名称,例如,它映射 "England" -> "England"、"English" -> "England"、"London" -> "England"。它可以很容易地存储在数据库或文件中并被检索。
然后我会在字典中搜索键,并用字典中的值标记项目。