【问题标题】:python: dictionaries of lists are somehow coupledpython:列表的字典以某种方式耦合
【发布时间】:2010-11-23 09:29:29
【问题描述】:

我编写了一个小 Python 程序来迭代数据文件 (input_file) 并执行计算。如果计算结果达到某些状态(stateAstateB),则从结果中提取信息(hits)。要提取的命中取决于三个参数集中的参数。
我使用字典字典来存储我的参数集 (param_sets),并使用列表字典来存储命中 (hits)。字典 param_setshits 具有相同的键。

问题是,

hits 字典中的列表以某种方式耦合。当一个列表发生变化时(通过调用 extract_hits 函数),其他列表也会发生变化。

这里是(缩短的)代码:

import os, sys, csv, pdb
from operator import itemgetter

# define three parameter sets
param_sets = {
    'A' : {'MIN_LEN' : 8, 'MAX_X' : 0, 'MAX_Z' : 0},
    'B' : {'MIN_LEN' : 8, 'MAX_X' : 1, 'MAX_Z' : 5},
    'C' : {'MIN_LEN' : 9, 'MAX_X' : 1, 'MAX_Z' : 5}}

# to store hits corresponding to each parameter set
hits = dict.fromkeys(param_sets, [])

# calculations
result = []
for input_values in input_file:
    # do some calculations
    result = do_some_calculations(result, input_values)
    if result == stateA:
        for key in param_sets.keys():
            hits[key] = extract_hits(key, result,
                                                hits[key],
                                                param_sets[key]['MIN_LEN'],
                                                param_sets[key]['MAX_X'],
                                                param_sets[key]['MAX_Z'])
        result = []  # discard results, start empty result list
    elif result == stateB:
        for key in param_sets.keys():
            local_heli[key] = extract_hits(key,
                                           result,
                                           hits[key],
                                           param_sets[key]['MIN_LEN'],
                                           param_sets[key]['MAX_X'],
                                           param_sets[key]['MAX_Z'])
        result = [] # discard results
        result = some_calculation(input_values) # start new result list
    else:
        result = some_other_calculation(result) # append result list



def extract_hits(k, seq, hits, min_len, max_au, max_gu):
    max_len = len(seq)
    for sub_seq_size in reversed(range(min_len, max_len+1)):
        for start_pos in range(0,(max_len-sub_seq_size+1)):
            from_inc = start_pos
            to_exc = start_pos + sub_seq_size
            sub_seq = seq[from_inc:to_exc]
            # complete information about helical fragment sub_seq
            helical_fragment = get_helix_data(sub_seq, max_au, max_gu)
            if helical_fragment:
                hits.append(helical_fragment)
                # search seq regions left and right from sub_seq for further hits
                left_seq = seq[0:from_inc]
                right_seq = seq[to_exc:max_len]
                if len(left_seq) >= min_len:
                    hits = sub_check_helical(left_seq, hits, min_len, max_au, max_gu)
                if len(right_seq) >= min_len:
                    hits = sub_check_helical(right_seq, hits, min_len, max_au, max_gu)
                print 'key', k                 # just for testing purpose
                print 'new', hits              # just for testing purpose
                print 'frag', helical_fragment # just for testing purpose
                pdb.set_trace()                # just for testing purpose
                return hits # appended
    return hits # unchanged

这里是python调试器的一些输出:

key A
new ['x', 'x', 'x', {'y': 'GGCCGGGCUUGGU'}]
frag {'y': 'GGCCGGGCUUGGU'}
> 
-> return hits
(Pdb) c
key B

new [{'y': 'GGCCGGGCUUGGU'}, {'y': 'CCGGCCCGAGCCG'}]
frag {'y': 'CCGGCCCGAGCCG'}
> extract_hits()
-> return hits
(Pdb) c
key C
new [{'y': 'GGCCGGGCUUGGU'}, {'y': 'CCGGCCCGAGCCG'}, {'y': 'CCGGCCCG'}]
frag {'y': 'CCGGCCCG'}
> extract_hits()
-> return hits

key A中的元素不应出现在key B中,key A和key B中的元素不应出现在key C中>。

【问题讨论】:

    标签: python variables dictionary


    【解决方案1】:

    字典和列表默认通过引用传递。对于字典,而不是:

    hits_old = hits      # just for testing purpose
    

    应该是:

    hits_old = hits.copy()      # just for testing purpose
    

    这将复制字典的键/值对,从而生成一个等效字典,其中不包含对命中字典的未来更改。

    当然,第二个函数中的 hits_old 实际上是一个列表,而不是字典,所以你需要做类似于以下的操作来复制它:

    hits_old = hits[:]
    

    我不知道为什么列表没有 copy() 函数,如果你想知道的话。

    【讨论】:

    • 谢谢,这很好。不过,我想知道为什么键“A”中的列表元素被复制到存储在全局命中字典中键“B”的列表中。也许,我只是对显而易见的事情视而不见,但我真的想不通。
    • 我认为这是因为 python 如何通过引用传递对象以及您如何处理那里的键。这是 testingreflections.com/node/view/5126 的链接,这是马口中的另一个链接... docs.python.org/reference/datamodel.html
    • .copy 或 [:] 的替代方法是创建一个新列表,将旧列表传递给构造函数。即newlist = list(other_list)new_dict = dict(other_dict)
    • 谢谢,伙计们!我真的虽然python会按值传递。所有问题都解决了——我想,我学到了一些重要的东西。
    【解决方案2】:

    您的线路:

    hits = dict.fromkeys(param_sets, [])
    

    相当于:

    hits = dict()
    onelist = []
    for k in param_sets:
        hits[k] = onelist
    

    也就是说,hits 中的每个条目的值都是相同的列表对象,无论它有什么键,最初都是空的。请记住,赋值不会执行隐式复制:相反,它会分配“对 RHS 对象的更多引用”。

    你想要的是:

    hits = dict()
    for k in param_sets:
        hits[k] = []
    

    也就是说,一个新的和单独的列表对象作为每个条目的值。相当于,

    hits = dict((k, []) for k in param_sets)
    

    顺便说一句,当您确实需要制作容器的(浅)副本时,最通用的方法通常是调用容器的类型,并以旧容器作为参数,如下所示:

    newdict = dict(olddict)
    newlist = list(oldlist)
    newset = set(oldset)
    

    等等;这也可以在类型之间转换容器(newlist = list(oldset) 从集合中创建一个列表,等等)。

    【讨论】:

    • @Simon,总是很乐意提供帮助,尽管为这样一个精巧的技术问题设置“社区 wiki”确实看起来很奇怪——你为什么这样做?!
    猜你喜欢
    • 1970-01-01
    • 2016-02-01
    • 2023-03-26
    • 2023-01-18
    • 1970-01-01
    • 2022-11-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多