【问题标题】:Python: Iterate through object executing code both at certain places and also at endPython:在某些地方和最后迭代对象执行代码
【发布时间】:2014-12-16 18:15:50
【问题描述】:

这里有一些示例代码来解释:

outputText=""
counter=0
for obj in specialObjects:
    if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
        print "The object %s is causing a section break."%obj.details
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        outputText=""
    outputText+=obj.shortValue()
# THIS CODE IS DUPLICATED
outputText = outputText.rjust(80)
open("file%d.txt"%counter,"w").write(outputText)

我需要做的是遍历这些特殊对象的列表并每次检查几个不同的条件。如果满足任何条件(如这里所示),那么我需要获取当前输出缓冲区,将其写入文件,然后启动新的输出缓冲区并继续处理。

这里的问题是代码重复。注意这两行(outputText= 和 open)是如何重复的。如果我未能放入第二组行,则将处理最后一组对象,但永远不会写入它们的输出。

我可以想到两种可能的解决方案来防止代码重复。这两个看起来都有些不雅,所以我想知道是否有更好的方法。

1) 包装将在函数中重复的代码。

outputText=""
counter=0
for obj in specialObjects:
    if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
        print "The object %s is causing a section break."%obj.details
        counter = writeData(outputText)
        outputText=""
    outputText+=obj.shortValue()
writeData(outputText,counter)

def writeData(outputText,counter):
    outputText = outputText.rjust(80)
    open("file%d.txt"%counter,"w").write(outputText)
    return counter+1

2) 使用数字 for 循环代替,并计数到比对象列表的长度大一;使用该值作为标志来表示“写入,但现在退出”:

outputText=""
counter=0
for obj in range(len(specialObjects))+1:
    if (obj = len(specialObjects)) or (specialObjects[obj].id < 400) or (specialObjects[obj].name.startswith("he")) or (specialOejcts[obj].deliberateBreak==True):
        print "The object %s is causing a section break."%specialObjects[obj].details
        outputText = outputText.rjust(80)
        open("file%d.txt"%counter,"w").write(outputText)
        outputText=""
        if (obj==len(specialObjects)):
            break 
    outputText+=specialObjects[obj].shortValue()

如果我必须选择一个,我可能会选择 #2,但如果需要使用任何更复杂的布尔逻辑,这最终可能会使用“if”语句创建一些奇怪的边缘情况。

是否有一种更简洁或更“Pythonic”的方式来实现这一点而无需重复代码?

谢谢!

【问题讨论】:

  • 你只改变了中间例子中的counter。第一个和最后一个版本真的应该多次打开同一个文件,然后直接丢弃而不关闭,还是缺少一些代码?

标签: python list code-duplication


【解决方案1】:

当我发现自己编写这样的代码时,我正在迭代一个集合并在循环结束后重复代码,我通常认为这是我没有迭代正确的东西的标志。

在这种情况下,您正在迭代一个对象列表。但我认为您真正想要迭代的是对象的列表。这就是itertools.groupby 的用处。

您的代码有很多内容,所以我将使用一个简化的示例来说明如何摆脱重复的代码。比如说,对于(一个非常人为的)示例,我有一个这样的列表:

things = ["apples", "oranges", "pears", None, 
          "potatoes", "tomatoes", None,
          "oatmeal", "eggs"]

这是一个对象列表。仔细观察,有几组由None 分隔的对象(请注意,您通常将things 表示为嵌套列表,但出于示例的目的我们忽略它)。我的目标是在单独的行上打印出每个组:

apples, oranges, pears
potatoes, tomatoes
oatmeal, eggs

这是这样做的“丑陋”方式:

current_things = []
for thing in things:
    if thing is None:
        print ", ".join(current_things)
        current_things = []
    else:
        current_things.append(thing)

print ", ".join(current_things)

如您所见,我们在循环之后重复了 print。恶心!

这是使用groupby的解决方案:

from itertools import groupby

for key, group in groupby(things, key=lambda x: x is not None):
    if key:
        print ", ".join(group)

groupby 接受一个可迭代的 (things) 和一个键函数。它查看可迭代对象的每个元素并应用 key 函数。当键值改变时,就会形成一个新组。结果是一个返回 (key, group) 对的迭代器。

在这种情况下,我们将使用检查None 作为我们的关键函数。这就是我们需要if key: 的原因,因为会有一组大小为1 的组对应于我们列表中的None 元素。我们将跳过这些。

如您所见,groupby 允许我们迭代我们真正想要迭代的事物:对象。这对我们的问题来说更自然,代码也因此得到了简化。看起来您的代码与上面的示例非常相似,只是您的键函数将检查对象的各种属性(obj.id &lt; 400 ...)。我将把实现细节留给你...

【讨论】:

    【解决方案2】:

    这是一种使用哨兵对象的方法。它类似于您的第二个选项,但我认为更清洁。

    for obj in itertools.chain(specialObjects, [None]):
        if (obj is None) or (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
            outputText = outputText.rjust(80)
            open("file%d.txt"%counter,"w").write(outputText)
            if obj is None: break
            print "The object %s is causing a section break."%obj.details
            outputText=""
        outputText+=obj.shortValue()
    

    【讨论】:

      【解决方案3】:

      您可以将分解对象的代码分离到生成器中,这样后面的处理步骤就不需要重复了。

      def yield_sections(specialObjects):
          outputText = ''
          for obj in specialObjects:
              if (obj.id < 400) or (obj.name.startswith("he")) or (obj.deliberateBreak==True):
                  yield outputText
                  outputText = ''
              outputText += obj.shortValue()
          if outputText:
              yield outputText
      
      
      for counter, outputText in enumerate(yield_sections(specialObjects)):
          outputText = outputText.rjust(80)
          open("file%d.txt"%counter,"w").write(outputText)
      

      【讨论】:

        【解决方案4】:

        如果你使用迭代器,有一个解决方案,next 可以在最后给出一个特殊的值。因此,您可以使用哨兵来检查您当前的对象是否是真实的,或者您是否完成了迭代。

        试试这样的:

        outputText=""
        counter=0
        ending = object()
        it = iter(specialObjects)
        while True:
            obj = next(it, ending)
            if obj is ending or obj.id < 400 or obj.name.startswith("he") or obj.deliberateBreak:
                outputText = outputText.rjust(80)
                open("file%d.txt"%counter,"w").write(outputText)
                counter += 1
                outputText=""
            if obj is ending:
                break
            outputText+=obj.shortValue()
        

        【讨论】:

          猜你喜欢
          • 2017-11-19
          • 2019-09-04
          • 2013-06-22
          • 1970-01-01
          • 2019-12-30
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多