【发布时间】:2011-09-15 04:42:55
【问题描述】:
我有一个整数列表,我希望能够识别连续的重复块:也就是说,我想生成一个保持顺序的重复列表,其中每个重复包含(int_in_question,出现次数)。
例如,如果我有一个类似的列表:
[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
我希望结果是:
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]
我有一个相当简单的方法,使用 for 循环、临时和计数器:
result_list = []
current = source_list[0]
count = 0
for value in source_list:
if value == current:
count += 1
else:
result_list.append((current, count))
current = value
count = 1
result_list.append((current, count))
但我真的很喜欢 python 的函数式编程习惯,我希望能够用一个简单的生成器表达式来做到这一点。但是,我发现在使用生成器时很难保持子计数。我觉得两步过程可能会让我到达那里,但现在我被难住了。
有没有一种特别优雅/pythonic 的方式来做到这一点,尤其是使用生成器?
【问题讨论】:
-
作为参考,这个过程被称为:en.wikipedia.org/wiki/Run-length_encoding
标签: list duplicates generator python