如何遍历字典并制作二维数组？答案

【问题标题】：How to loop through a dictionary of dictionaries and make a 2d array?如何遍历字典并制作二维数组？
【发布时间】：2019-12-17 15:35:43
【问题描述】：

所以，我有一本这样的字典：

dic_parsed_sentences = {'religion': {'david': 1, 'joslin': 1, 'apolog': 5, 'jim': 1, 'meritt': 2}, 
 'sport': {'sari': 1, 'basebal': 1, 'kolang': 5, 'footbal': 1, 'baba': 2},
 'education': {'madrese': 1, 'kelas': 1, 'yahyah': 5, 'dars': 1},
 'computer': {'net': 1, 'internet': 1},
 'windows': {'copy': 1, 'right': 1}}

我想根据该字典中字典的长度循环遍历它。

例如，
它有两个长度为 5 的项目，一个长度为 4 的项目，以及两个长度为 2 的项目。我想一起处理相同长度的项目（类似于 pandas 中的 group by）。
因此，第一次迭代的输出将如下所示（如您所见，此处只有长度为 5 的项目）：

[[david, joslin, apolog, jim, meritt],
 [sari, baseball, kolang, footbal, baba]]

和下一次迭代它将制作下一个相同长度的项目：

[[madrese, kelas, yahyah, dars]]

以及最后一次迭代：

[[net, internet],
 [copy, right]]

为什么我们这里只有三个迭代？因为我们在字典dic_parsed_sentences 中只有三个不同长度的项目。我做过这样的事情，但我不知道如何遍历相同长度的项目：

for i in dic_parsed_sentences.groupby(dic_parsed_sentences.same_length_items): # this line is sodoku line I dont know how to code it(I mean iterate through same length items in the dicts)
    for index_file in dic_parsed_sentences:
        temp_sentence = dic_parsed_sentences[index_file]
        keys_words = list(temp_sentence.keys())
        for index_word in range(len(keys_words)):
            arr_sent_wids[index_sentence, index_word] = 
                                keys_words[index_word]
    index = index + 1
    index_sentence = index_sentence + 1

更新：

for length, dics in itertools.groupby(dic_parsed_sentences, len):
    for index_file in dics:
        temp_sentence = dics[index_file]
        keys_words = list(temp_sentence.keys())
        for index_word in range(len(keys_words)):
                test_sent_wids[index_sentence, index_word] = lookup_word2id(keys_words[index_word])
        index = index + 1
        index_sentence = index_sentence + 1

【问题讨论】：

“项目的长度”是什么意思？
我的意思是第二个字典中项目的长度。所以外部 dic 中有两个长度为 5 的 dic
@sobek 我还包括了示例，请参阅我的更新
请提供minimal reproducible example，包括预期输出和有效代码。（例如for in无效）
@wjandrea 确定我做了一个最小的可重现示例。实际上，我知道这是不正确的，那部分是我不知道如何编程的部分，这就是为什么我只是把我的意思写成数独。当然我会更新

标签： python arrays dictionary multidimensional-array

【解决方案1】：

按长度对字典元素排序后可以使用itertools.groupby。

import itertools
items = sorted(dic_parsed_sentences.values(), key = len, reverse = True)
for length, dics in itertools.groupby(items, len):
    # dics is all the nested dictionaries with this length
    for temp_sentence in dics:
        keys_words = list(temp_sentence.keys())
        for index_word in range(len(keys_words)):
                test_sent_wids[index_sentence, index_word] = lookup_word2id(keys_words[index_word])
        index = index + 1
        index_sentence = index_sentence + 1

【讨论】：

非常感谢您的帮助。我有小问题让它工作。它说TypeError: 'itertools._grouper' object is not subscriptable
dics 不是字典。只需使用for temp_sentence in dics:
其实我和你运行同一个脚本，得到了这个'str' object has no attribute 'keys'我觉得the temp_sentence里面没有keys
需要使用dic_parsed_sentences.values() 来获取值而不是键。
你不能在for循环中增加一个计数器吗？

【解决方案2】：

bylen = {}
for v in dic_parsed_sentences.values():
    l = len(v)
    if not l in bylen:
        bylen[l] = []
    bylen[l].append(list(v.keys()))

for k in reversed(sorted(bylen.keys())):
    # use bylen[k]

【讨论】：

【解决方案3】：

您可以使用以下方法：

finds = [[key, len(dic_parsed_sentences[key])] for key in dic_parsed_sentences]
finds.sort(reverse=True, key=lambda x: x[1])

previous = finds[0][1]
res = []
for elem in finds:
    current = elem[1]
    if current != previous:
        previous = current
        print(res)
        res = []
    res.append(list(dic_parsed_sentences[elem[0]]))
print(res)

【讨论】：