Python：在某些地方和最后迭代对象执行代码答案

【问题标题】：Python: Iterate through object executing code both at certain places and also at endPython：在某些地方和最后迭代对象执行代码
【发布时间】：2014-12-16 18:15:50
【问题描述】：

这里有一些示例代码来解释：

outputText=""
counter=0
for obj in specialObjects:
    if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
        print "The object %s is causing a section break."%obj.details
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        outputText=""
    outputText+=obj.shortValue()
# THIS CODE IS DUPLICATED
outputText = outputText.rjust(80)
open("file%d.txt"%counter,"w").write(outputText)

我需要做的是遍历这些特殊对象的列表并每次检查几个不同的条件。如果满足任何条件（如这里所示），那么我需要获取当前输出缓冲区，将其写入文件，然后启动新的输出缓冲区并继续处理。

这里的问题是代码重复。注意这两行（outputText= 和 open）是如何重复的。如果我未能放入第二组行，则将处理最后一组对象，但永远不会写入它们的输出。

我可以想到两种可能的解决方案来防止代码重复。这两个看起来都有些不雅，所以我想知道是否有更好的方法。

1) 包装将在函数中重复的代码。

outputText=""
counter=0
for obj in specialObjects:
    if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
        print "The object %s is causing a section break."%obj.details
        counter = writeData(outputText)
        outputText=""
    outputText+=obj.shortValue()
writeData(outputText,counter)

def writeData(outputText,counter):
    outputText = outputText.rjust(80)
    open("file%d.txt"%counter,"w").write(outputText)
    return counter+1

2) 使用数字 for 循环代替，并计数到比对象列表的长度大一；使用该值作为标志来表示“写入，但现在退出”：

outputText=""
counter=0
for obj in range(len(specialObjects))+1:
    if (obj = len(specialObjects)) or (specialObjects[obj].id < 400) or (specialObjects[obj].name.startswith("he")) or (specialOejcts[obj].deliberateBreak==True):
        print "The object %s is causing a section break."%specialObjects[obj].details
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        outputText=""
        if (obj==len(specialObjects)):
            break 
    outputText+=specialObjects[obj].shortValue()

如果我必须选择一个，我可能会选择 #2，但如果需要使用任何更复杂的布尔逻辑，这最终可能会使用“if”语句创建一些奇怪的边缘情况。

是否有一种更简洁或更“Pythonic”的方式来实现这一点而无需重复代码？

谢谢！

【问题讨论】：

你只改变了中间例子中的counter。第一个和最后一个版本真的应该多次打开同一个文件，然后直接丢弃而不关闭，还是缺少一些代码？
这可能与Avoiding repeat of code after loop?重复

标签： python list code-duplication

【解决方案1】：

当我发现自己编写这样的代码时，我正在迭代一个集合并在循环结束后重复代码，我通常认为这是我没有迭代正确的东西的标志。

在这种情况下，您正在迭代一个对象列表。但我认为您真正想要迭代的是对象的组列表。这就是itertools.groupby 的用处。

您的代码有很多内容，所以我将使用一个简化的示例来说明如何摆脱重复的代码。比如说，对于（一个非常人为的）示例，我有一个这样的列表：

things = ["apples", "oranges", "pears", None, 
          "potatoes", "tomatoes", None,
          "oatmeal", "eggs"]

这是一个对象列表。仔细观察，有几组由None 分隔的对象（请注意，您通常将things 表示为嵌套列表，但出于示例的目的我们忽略它）。我的目标是在单独的行上打印出每个组：

apples, oranges, pears
potatoes, tomatoes
oatmeal, eggs

这是这样做的“丑陋”方式：

current_things = []
for thing in things:
    if thing is None:
        print ", ".join(current_things)
        current_things = []
    else:
        current_things.append(thing)

print ", ".join(current_things)

如您所见，我们在循环之后重复了 print。恶心！

这是使用groupby的解决方案：

from itertools import groupby

for key, group in groupby(things, key=lambda x: x is not None):
    if key:
        print ", ".join(group)

groupby 接受一个可迭代的 (things) 和一个键函数。它查看可迭代对象的每个元素并应用 key 函数。当键值改变时，就会形成一个新组。结果是一个返回 (key, group) 对的迭代器。

在这种情况下，我们将使用检查None 作为我们的关键函数。这就是我们需要if key: 的原因，因为会有一组大小为1 的组对应于我们列表中的None 元素。我们将跳过这些。

如您所见，groupby 允许我们迭代我们真正想要迭代的事物：组对象。这对我们的问题来说更自然，代码也因此得到了简化。看起来您的代码与上面的示例非常相似，只是您的键函数将检查对象的各种属性（obj.id < 400 ...）。我将把实现细节留给你...

【讨论】：

【解决方案2】：

这是一种使用哨兵对象的方法。它类似于您的第二个选项，但我认为更清洁。

for obj in itertools.chain(specialObjects, [None]):
    if (obj is None) or (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        if obj is None: break
        print "The object %s is causing a section break."%obj.details
        outputText=""
    outputText+=obj.shortValue()

【讨论】：

【解决方案3】：

您可以将分解对象的代码分离到生成器中，这样后面的处理步骤就不需要重复了。

def yield_sections(specialObjects):
    outputText = ''
    for obj in specialObjects:
        if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
            yield outputText
            outputText = ''
        outputText += obj.shortValue()
    if outputText:
        yield outputText


for counter, outputText in enumerate(yield_sections(specialObjects)):
    outputText = outputText.rjust(80)
    open("file%d.txt"%counter,"w").write(outputText)

【讨论】：

【解决方案4】：

如果你使用迭代器，有一个解决方案，next 可以在最后给出一个特殊的值。因此，您可以使用哨兵来检查您当前的对象是否是真实的，或者您是否完成了迭代。

试试这样的：

outputText=""
counter=0
ending = object()
it = iter(specialObjects)
while True:
    obj = next(it, ending)
    if obj is ending or obj.id < 400 or obj.name.startswith("he") or obj.deliberateBreak:
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        counter += 1
        outputText=""
    if obj is ending:
        break
    outputText+=obj.shortValue()

【讨论】：