【发布时间】:2015-03-20 17:42:47
【问题描述】:
我是 Python 新手,在 Python 中仍然试图摆脱 C++ 编码技术,所以如果这是一个微不足道的问题,请原谅我。我似乎找不到最符合 Python 风格的方法。
我有两个字典列表。两个列表中的单个字典可能包含嵌套字典。 (如果你好奇的话,它实际上是一些 Yelp 数据。)第一个 dicts 列表包含如下条目:
{business_id': 'JwUE5GmEO-sH1FuwJgKBlQ',
'categories': ['Restaurants'],
'type': 'business'
...}
第二个字典列表包含如下条目:
{'business_id': 'vcNAWiLM4dR7D2nwwJ7nCA',
'date': '2010-03-22',
'review_id': 'RF6UnRTtG7tWMcrO2GEoAg',
'stars': 2,
'text': "This is a basic review",
...}
我想做的是提取第二个列表中与第一个列表中的特定类别匹配的所有条目。例如,如果我对餐馆感兴趣,我只想要第二个列表中的整体,其中 business_id 与第一个列表中的 business_id 匹配,并且单词 Restaurants 出现在 categories 的值列表中.
如果我将这两个列表作为 SQL 中的表,我会在 business_id 属性上进行连接,然后只需一个简单的过滤器来获取我想要的行(其中Restaurants IN categories,或类似的东西)。
这两个列表非常大,所以我遇到了效率和内存空间问题。在我将所有这些都推入 SQL 数据库之前,谁能给我一些指点?我已经搞砸了一些熊猫,所以我确实有一些有限的经验。我在合并过程中遇到了问题。
【问题讨论】:
标签: python list python-2.7 dictionary