遍历 Python 字典中的部分元组键答案

【问题标题】：Iterate over part of tuple key in Python dictionary遍历 Python 字典中的部分元组键
【发布时间】：2017-12-14 05:12:59
【问题描述】：

我正在做一个优化项目，我有一系列以元组作为键的字典和另一个字典（Gurobi 的决策变量），其中键是其他字典中元组的第一个元素。我需要能够做到以下几点：

data1 = {(place, person): q}
data2 = {person: s}
x = {place: var}

qx = {k: x[k]*data1[k] for k in x}
total1 = {}
for key, value in qx.items():
    person = key[1]
    if person in total1:
        total1[person] = total1[person] + value
    else:
        total1[person] = value
total2 = {k: total1[k]/data2[k] for k in total1}

（请注意，data1、data2 和 x 字典非常大，有 10,000 多个不同的地点/人对）。

当我使用原始数据代替使用相同 (place, person) 键的决策变量时，同样的过程会起作用。不幸的是，我在 Gurobi 模型中的变量本身必须是一个字典，并且不能包含 person 键值。

有没有办法只遍历元组键中的第一个值？

编辑：以下是一些示例值（敏感数据，因此占位符值）：

data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
data2 = {a: 7.8, b: 8.5, c: 8.4}
x = {1: 0.002, 2: 0.013}

data1 中的值都是整数，data2 是小时，x 是小数。

total2 的输出应类似于以下内容（假设每个人还有许多其他行）：

total2 = {a: 0.85, b: 1.2, c: 1.01}

此代码本质上是计算每个人的“生产力分数”。决策变量 x 仅出于业务目的查看每个单独的地点，因此它不能包含人员标识符。此外，Gurobi 包对如何格式化事物有很大的限制，所以我还没有找到一种方法来使用 x 的元组键。

【问题讨论】：

请提供一些简短的输入和输出数据样本。
你是如何得到total2中的这些数字的？
抱歉，我没有对样本数据进行实际数学计算。这些是我使用整个数据集得到的结果，其中每个地方的每个人都包含超过 100 行。

标签： python python-3.x dictionary

【解决方案1】：

通常，将值聚合到 bin 中的最有效方法是使用 for 循环并将值存储在字典中，就像您在示例中使用 total1 所做的那样。在下面的代码中，我已经修复了您的 qx 行，以便它运行，但我不知道这是否符合您的意图。我还使用了total1.setdefault 对代码进行了一点精简：

a, b, c = 'a', 'b', 'c'
data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
data2 = {a: 7.8, b: 8.5, c: 8.4}
x = {1: 0.002, 2: 0.013}

qx = {place, person: x[place] * value for (place, person), value in data1.items()}
total1 = {}
for (place, person), value in qx.items():
    total1.setdefault(person, 0.0)
    total1[person] += value
total2 = {k: total1[k] / data2[k] for k in total1}

print(total2)
# {'a': 0.0071794871794871795, 'c': 0.013571428571428571, 'b': 0.19117647058823528}

但这不会产生您要求的结果。我无法一眼看出您是如何获得显示的结果的，但这可能会帮助您朝着正确的方向前进。

如果您将qx 逻辑移到循环中，也可能更易于阅读，如下所示：

total1 = {}
for (place, person), value in data1.items():
    total1.setdefault(person, 0.0)
    total1[person] += x[place] * value
total2 = {k: total1[k] / data2[k] for k in total1}

或者，如果您想经常这样做，可能值得在人员及其匹配地点之间创建一个交叉引用，正如@martijn-pieters 建议的那样（注意，您仍然需要一个for 循环来执行初始操作交叉引用）：

# create a list of valid places for each person
places_for_person = {}
for place, person in data1:
    places_for_person.setdefault(person, [])
    places_for_person[person].append(place)
# now do the calculation
total2 = {
    person: 
    sum(
        data1[place, person] * x[place]
        for place in places_for_person[person]
    ) / data2[person]
    for person in data2
}

【讨论】：

谢谢！流线型的位非常有用。在这一点上，我仍然无法让 total1 与 x 一起使用，所以我觉得这更多地与 Gurobi 处理事物的方式有关，而不是直接的 Python 语法。
很高兴为您提供帮助！如果您经常这样做，您也可以尝试total1=collections.defaultdict(list) 作为第一个示例或total1=collections.defaultdict(float) 作为第二个示例（而不是使用标准的dict）。那么你甚至不需要setdefault 部分。
顺便说一句，如果您在 Python 中进行大量优化，您可能会考虑使用 Pyomo 包。它是一个强大、成熟的软件包，允许您使用几乎任何求解器而无需更改代码（gurobi、cplex、glpk、cbc 等）。也有一些很好的随机编程扩展。

【解决方案2】：

用于创建删除元组的新字典：

a, b, c = "a", "b", "c"
data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
total = list()

spot = 0 
for a in data1:
    total.append(list(a[1])) # Add new Lists to list "total" containing the Key values
    total[spot].append(data1[a]) # Add Values to Keys judging from their spot in the list
    spot += 1 # to keep the spot in correct place in lists

total = dict(total) # convert it to dictionary
print(total)

输出：

{'a': 28, 'c': 57, 'b': 125}

【讨论】：

它似乎不是很优化。作者说数据集很大。