【问题标题】:Iterate over part of tuple key in Python dictionary遍历 Python 字典中的部分元组键
【发布时间】:2017-12-14 05:12:59
【问题描述】:

我正在做一个优化项目,我有一系列以元组作为键的字典和另一个字典(Gurobi 的决策变量),其中键是其他字典中元组的第一个元素。我需要能够做到以下几点:

data1 = {(place, person): q}
data2 = {person: s}
x = {place: var}

qx = {k: x[k]*data1[k] for k in x}
total1 = {}
for key, value in qx.items():
    person = key[1]
    if person in total1:
        total1[person] = total1[person] + value
    else:
        total1[person] = value
total2 = {k: total1[k]/data2[k] for k in total1}

(请注意,data1、data2 和 x 字典非常大,有 10,000 多个不同的地点/人对)。

当我使用原始数据代替使用相同 (place, person) 键的决策变量时,同样的过程会起作用。不幸的是,我在 Gurobi 模型中的变量本身必须是一个字典,并且不能包含 person 键值。

有没有办法只遍历元组键中的第一个值?

编辑: 以下是一些示例值(敏感数据,因此占位符值):

data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
data2 = {a: 7.8, b: 8.5, c: 8.4}
x = {1: 0.002, 2: 0.013}

data1 中的值都是整数,data2 是小时,x 是小数。

total2 的输出应类似于以下内容(假设每个人还有许多其他行):

total2 = {a: 0.85, b: 1.2, c: 1.01}

此代码本质上是计算每个人的“生产力分数”。决策变量 x 仅出于业务目的查看每个单独的地点,因此它不能包含人员标识符。此外,Gurobi 包对如何格式化事物有很大的限制,所以我还没有找到一种方法来使用 x 的元组键。

【问题讨论】:

  • 请提供一些简短的输入和输出数据样本。
  • 你是如何得到total2中的这些数字的?
  • 抱歉,我没有对样本数据进行实际数学计算。这些是我使用整个数据集得到的结果,其中每个地方的每个人都包含超过 100 行。

标签: python python-3.x dictionary


【解决方案1】:

通常,将值聚合到 bin 中的最有效方法是使用 for 循环并将值存储在字典中,就像您在示例中使用 total1 所做的那样。在下面的代码中,我已经修复了您的 qx 行,以便它运行,但我不知道这是否符合您的意图。我还使用了total1.setdefault 对代码进行了一点精简:

a, b, c = 'a', 'b', 'c'
data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
data2 = {a: 7.8, b: 8.5, c: 8.4}
x = {1: 0.002, 2: 0.013}

qx = {place, person: x[place] * value for (place, person), value in data1.items()}
total1 = {}
for (place, person), value in qx.items():
    total1.setdefault(person, 0.0)
    total1[person] += value
total2 = {k: total1[k] / data2[k] for k in total1}

print(total2)
# {'a': 0.0071794871794871795, 'c': 0.013571428571428571, 'b': 0.19117647058823528}

但这不会产生您要求的结果。我无法一眼看出您是如何获得显示的结果的,但这可能会帮助您朝着正确的方向前进。

如果您将qx 逻辑移到循环中,也可能更易于阅读,如下所示:

total1 = {}
for (place, person), value in data1.items():
    total1.setdefault(person, 0.0)
    total1[person] += x[place] * value
total2 = {k: total1[k] / data2[k] for k in total1}

或者,如果您想经常这样做,可能值得在人员及其匹配地点之间创建一个交叉引用,正如@martijn-pieters 建议的那样(注意,您仍然需要一个for 循环来执行初始操作交叉引用):

# create a list of valid places for each person
places_for_person = {}
for place, person in data1:
    places_for_person.setdefault(person, [])
    places_for_person[person].append(place)
# now do the calculation
total2 = {
    person: 
    sum(
        data1[place, person] * x[place]
        for place in places_for_person[person]
    ) / data2[person]
    for person in data2
}

【讨论】:

  • 谢谢!流线型的位非常有用。在这一点上,我仍然无法让 total1 与 x 一起使用,所以我觉得这更多地与 Gurobi 处理事物的方式有关,而不是直接的 Python 语法。
  • 很高兴为您提供帮助!如果您经常这样做,您也可以尝试total1=collections.defaultdict(list) 作为第一个示例或total1=collections.defaultdict(float) 作为第二个示例(而不是使用标准的dict)。那么你甚至不需要setdefault 部分。
  • 顺便说一句,如果您在 Python 中进行大量优化,您可能会考虑使用 Pyomo 包。它是一个强大、成熟的软件包,允许您使用几乎任何求解器而无需更改代码(gurobi、cplex、glpk、cbc 等)。也有一些很好的随机编程扩展。
【解决方案2】:

用于创建删除元组的新字典:

a, b, c = "a", "b", "c"
data1 = {(1, a): 28, (1, c): 57, (2, b): 125}
total = list()

spot = 0 
for a in data1:
    total.append(list(a[1])) # Add new Lists to list "total" containing the Key values
    total[spot].append(data1[a]) # Add Values to Keys judging from their spot in the list
    spot += 1 # to keep the spot in correct place in lists

total = dict(total) # convert it to dictionary
print(total)

输出:

{'a': 28, 'c': 57, 'b': 125}

【讨论】:

  • 它似乎不是很优化。作者说数据集很大。
猜你喜欢
  • 2015-07-22
  • 2021-11-23
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-09-24
  • 2014-05-15
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多