【发布时间】:2019-03-16 16:08:56
【问题描述】:
我有数千个pd.Series 项目,我只想添加它们。他们考虑不同的时间间隔,我需要用零填充缺失值。我试过了
add_series = lambda a, b: a.add(b, fill_value=0).fillna(0)
result = reduce(add_series, all_my_items)
这比我预期的要花更多的时间。有什么办法可以显着加快速度?
【问题讨论】:
-
.fillna(0)在fill_value=0之后不是多余的吗? -
我不知道这是否对您的特定情况有帮助,但通常添加
Series、附加到DataFrames 等非常慢。你能合并原始数据,然后在最后构造一个Series对象吗? -
@ALollz:是的,在这种情况下,我也用它来添加框架。
-
@Batman:谢谢,我怀疑,只是想知道我是否遗漏了一些明显的东西。我会尽量按照你建议的方式处理它
标签: python pandas performance series