你如何在 Python 中创建嵌套字典？答案

【问题标题】：How do you create nested dict in Python?你如何在 Python 中创建嵌套字典？
【发布时间】：2013-04-26 08:16:57
【问题描述】：

我有 2 个 CSV 文件：“数据”和“映射”：

“映射”文件有 4 列：Device_Name、GDN、Device_Type 和 Device_OS。所有四列都已填充。
“数据”文件具有这些相同的列，Device_Name 列已填充，其他三列为空白。
我希望我的 Python 代码打开这两个文件，并为数据文件中的每个 Device_Name 映射映射文件中的 GDN、Device_Type 和 Device_OS 值。

我知道在只有 2 列时如何使用 dict（需要映射 1 列），但是当需要映射 3 列时我不知道如何实现。

以下是我尝试完成Device_Type映射的代码：

x = dict([])
with open("Pricing Mapping_2013-04-22.csv", "rb") as in_file1:
    file_map = csv.reader(in_file1, delimiter=',')
    for row in file_map:
       typemap = [row[0],row[2]]
       x.append(typemap)

with open("Pricing_Updated_Cleaned.csv", "rb") as in_file2, open("Data Scraper_GDN.csv", "wb") as out_file:
    writer = csv.writer(out_file, delimiter=',')
    for row in csv.reader(in_file2, delimiter=','):
         try:
              row[27] = x[row[11]]
         except KeyError:
              row[27] = ""
         writer.writerow(row)

它返回Attribute Error。

经过一番研究，我认为我需要创建一个嵌套字典，但我不知道如何做到这一点。

【问题讨论】：

Device_Name 列是两个文件中的键，在此键上我想将 Device_OS、GDN 和 Device_Type 值从映射文件映射到数据文件。
你想要像row[27] = x[row[11]]["Device_OS"]这样的事情吗？
另见： search for key in nested dict -- python dpath
这不一定需要嵌套字典。你可以使用pandas，read_csv，将Device_Name设为索引，然后你可以直接join索引上的两个数据框Device_Name。

标签： python python-2.7 dictionary mapping nested

【解决方案1】：

嵌套字典是字典中的字典。很简单的事情。

>>> d = {}
>>> d['dict1'] = {}
>>> d['dict1']['innerkey'] = 'value'
>>> d['dict1']['innerkey2'] = 'value2'
>>> d
{'dict1': {'innerkey': 'value', 'innerkey2': 'value2'}}

您还可以使用collections 包中的defaultdict 来帮助创建嵌套字典。

>>> import collections
>>> d = collections.defaultdict(dict)
>>> d['dict1']['innerkey'] = 'value'
>>> d  # currently a defaultdict type
defaultdict(<type 'dict'>, {'dict1': {'innerkey': 'value'}})
>>> dict(d)  # but is exactly like a normal dictionary.
{'dict1': {'innerkey': 'value'}}

您可以随意填充。

我会在你的代码中推荐一些类似的东西：

d = {}  # can use defaultdict(dict) instead

for row in file_map:
    # derive row key from something 
    # when using defaultdict, we can skip the next step creating a dictionary on row_key
    d[row_key] = {} 
    for idx, col in enumerate(row):
        d[row_key][idx] = col

根据你的comment：

上面的代码可能会混淆问题。简而言之我的问题：我有 2 个文件 a.csv b.csv，a.csv 有 4 列 i j k l，b.csv 也有这些列。 i 是这些 csvs 的关键列。 j k l 列在 a.csv 中为空，但在 b.csv 中填充。我想映射 j k 的值 l 列使用'i`作为从b.csv到a.csv文件的关键列

我的建议是类似（不使用默认字典）：

a_file = "path/to/a.csv"
b_file = "path/to/b.csv"

# read from file a.csv
with open(a_file) as f:
    # skip headers
    f.next()
    # get first colum as keys
    keys = (line.split(',')[0] for line in f) 

# create empty dictionary:
d = {}

# read from file b.csv
with open(b_file) as f:
    # gather headers except first key header
    headers = f.next().split(',')[1:]
    # iterate lines
    for line in f:
        # gather the colums
        cols = line.strip().split(',')
        # check to make sure this key should be mapped.
        if cols[0] not in keys:
            continue
        # add key to dict
        d[cols[0]] = dict(
            # inner keys are the header names, values are columns
            (headers[idx], v) for idx, v in enumerate(cols[1:]))

但请注意，用于解析 csv 文件有一个 csv module。

【讨论】：

可能是上面的代码令人困惑的问题。简而言之，我的问题：我有 2 个文件 a.csv b.csv，a.csv 有 4 列 i j k l，b.csv 也有这些列。 i 是这些 csvs 的关键列。 j k l 列在 a.csv 中为空，但在 b.csv 中填充。我想使用 'i` 作为键列将 j k l 列的值从 b.csv 映射到 a.csv 文件。

【解决方案2】：

更新：对于任意长度的嵌套字典，请转至this answer。

使用集合中的 defaultdict 函数。

高性能：当数据集很大时，“if key not in dict”非常昂贵。

低维护：使代码更具可读性，易于扩展。

from collections import defaultdict

target_dict = defaultdict(dict)
target_dict[key1][key2] = val

【讨论】：

from collections import defaultdict target_dict = defaultdict(dict) target_dict['1']['2'] 给我target_dict['1']['2'] KeyError: '2'
你必须先赋值才能得到它。

【解决方案3】：

对于任意级别的嵌套：

In [2]: def nested_dict():
   ...:     return collections.defaultdict(nested_dict)
   ...:

In [3]: a = nested_dict()

In [4]: a
Out[4]: defaultdict(<function __main__.nested_dict>, {})

In [5]: a['a']['b']['c'] = 1

In [6]: a
Out[6]:
defaultdict(<function __main__.nested_dict>,
            {'a': defaultdict(<function __main__.nested_dict>,
                         {'b': defaultdict(<function __main__.nested_dict>,
                                      {'c': 1})})})

【讨论】：

上述答案对两行函数的作用，您也可以对单行 lambda 进行操作，如 this answer。

【解决方案4】：

请务必记住，在使用 defaultdict 和类似的嵌套 dict 模块（例如 nested_dict）时，查找不存在的键可能会无意中在 dict 中创建新的键条目并造成大量破坏。强>

这是一个带有 nested_dict 模块的 Python3 示例：

import nested_dict as nd
nest = nd.nested_dict()
nest['outer1']['inner1'] = 'v11'
nest['outer1']['inner2'] = 'v12'
print('original nested dict: \n', nest)
try:
    nest['outer1']['wrong_key1']
except KeyError as e:
    print('exception missing key', e)
print('nested dict after lookup with missing key.  no exception raised:\n', nest)

# Instead, convert back to normal dict...
nest_d = nest.to_dict(nest)
try:
    print('converted to normal dict. Trying to lookup Wrong_key2')
    nest_d['outer1']['wrong_key2']
except KeyError as e:
    print('exception missing key', e)
else:
    print(' no exception raised:\n')

# ...or use dict.keys to check if key in nested dict
print('checking with dict.keys')
print(list(nest['outer1'].keys()))
if 'wrong_key3' in list(nest.keys()):

    print('found wrong_key3')
else:
    print(' did not find wrong_key3')

输出是：

original nested dict:   {"outer1": {"inner2": "v12", "inner1": "v11"}}

nested dict after lookup with missing key.  no exception raised:  
{"outer1": {"wrong_key1": {}, "inner2": "v12", "inner1": "v11"}} 

converted to normal dict. 
Trying to lookup Wrong_key2 

exception missing key 'wrong_key2' 

checking with dict.keys 

['wrong_key1', 'inner2', 'inner1']  
did not find wrong_key3

【讨论】：

【解决方案5】：

pip install addict

from addict import Dict

mapping = Dict()
mapping.a.b.c.d.e = 2
print(mapping)  # {'a': {'b': {'c': {'d': {'e': 2}}}}}

参考资料：

【讨论】：

【解决方案6】：

如果你想创建一个给定路径列表（任意长度）的嵌套字典，并对路径末尾可能存在的项目执行函数，这个方便的小递归函数非常有用：

def ensure_path(data, path, default=None, default_func=lambda x: x):
    """
    Function:

    - Ensures a path exists within a nested dictionary

    Requires:

    - `data`:
        - Type: dict
        - What: A dictionary to check if the path exists
    - `path`:
        - Type: list of strs
        - What: The path to check

    Optional:

    - `default`:
        - Type: any
        - What: The default item to add to a path that does not yet exist
        - Default: None

    - `default_func`:
        - Type: function
        - What: A single input function that takes in the current path item (or default) and adjusts it
        - Default: `lambda x: x` # Returns the value in the dict or the default value if none was present
    """
    if len(path)>1:
        if path[0] not in data:
            data[path[0]]={}
        data[path[0]]=ensure_path(data=data[path[0]], path=path[1:], default=default, default_func=default_func)
    else:
        if path[0] not in data:
            data[path[0]]=default
        data[path[0]]=default_func(data[path[0]])
    return data

例子：

data={'a':{'b':1}}
ensure_path(data=data, path=['a','c'], default=[1])
print(data) #=> {'a':{'b':1, 'c':[1]}}
ensure_path(data=data, path=['a','c'], default=[1], default_func=lambda x:x+[2])
print(data) #=> {'a': {'b': 1, 'c': [1, 2]}}

【讨论】：

【解决方案7】：

这个东西是空的嵌套列表，ne 会将数据附加到空字典中

ls = [['a','a1','a2','a3'],['b','b1','b2','b3'],['c','c1','c2','c3'], 
['d','d1','d2','d3']]

这意味着在 data_dict 中创建四个空字典

data_dict = {f'dict{i}':{} for i in range(4)}
for i in range(4):
    upd_dict = {'val' : ls[i][0], 'val1' : ls[i][1],'val2' : ls[i][2],'val3' : ls[i][3]}

    data_dict[f'dict{i}'].update(upd_dict)

print(data_dict)

输出

{'dict0': {'val': 'a', 'val1': 'a1', 'val2': 'a2', 'val3': 'a3'}, 'dict1'：{'val'：'b'，'val1'：'b1'，'val2'：'b2'，'val3'：'b3'}，'dict2'： {'val'：'c'，'val1'：'c1'，'val2'：'c2'，'val3'：'c3'}，'dict3'：{'val'：'d'，'val1' ：'d1'，'val2'：'d2'，'val3'：'d3'}}

【讨论】：

【解决方案8】：

#in jupyter
import sys
!conda install -c conda-forge --yes --prefix {sys.prefix} nested_dict 
import nested_dict as nd
d = nd.nested_dict()

'd' 现在可以用来存储嵌套的键值对了。

【讨论】：

【解决方案9】：

travel_log = {
    "France" : {"cities_visited" : ["paris", "lille", "dijon"], "total_visits" : 10},
    "india" : {"cities_visited" : ["Mumbai", "delhi", "surat",], "total_visits" : 12}
}

【讨论】：

请添加一些细节，为什么这个答案比之前给出的答案更好。促使您发布的其他答案有什么问题？为答案提供上下文是帮助未来读者的最佳方式。