【发布时间】:2018-01-04 08:33:24
【问题描述】:
Pandas 文档列出了一堆“扩展窗口函数”:
http://pandas.pydata.org/pandas-docs/version/0.17.0/api.html#standard-expanding-window-functions
但我无法从文档中弄清楚他们做了什么。
【问题讨论】:
标签: pandas
Pandas 文档列出了一堆“扩展窗口函数”:
http://pandas.pydata.org/pandas-docs/version/0.17.0/api.html#standard-expanding-window-functions
但我无法从文档中弄清楚他们做了什么。
【问题讨论】:
标签: pandas
您可能想阅读this Pandas docs:
滚动统计信息的常见替代方法是使用扩展 窗口,它产生具有所有数据的统计值 在那个时间点之前可用。
它们遵循与 .rolling 类似的界面,带有 .expanding 方法返回一个 Expanding 对象。
由于这些计算是滚动统计的一种特殊情况,它们 在 pandas 中实现,因此以下两个调用是 等效:
In [96]: df.rolling(window=len(df), min_periods=1).mean()[:5]
Out[96]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
In [97]: df.expanding(min_periods=1).mean()[:5]
Out[97]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
【讨论】:
【讨论】:
用一行来总结滚动和扩展功能的区别: 在滚动函数中,窗口大小保持不变,而在扩展函数中,它会发生变化。
示例: 假设你想预测天气,你有 100 天的数据:
滚动:假设窗口大小为 10。对于第一次预测,它将使用(前一个)10 天的数据并预测第 11 天。对于下一个预测,它将使用第 2 天(数据点)来第 11 天的数据。
扩展:对于第一次预测,它将使用 10 天的数据。但是,对于第二次预测,它将使用 10 + 1 天 的数据。窗口因此“扩大”了。
代码示例:
sums = series.expanding(min_periods=2).sum()
series 包含以前下载的应用程序数量随时间序列的数据。
以上编写的代码行汇总了截至当时所有下载的应用程序数量。
注意:min_periods=2 表示我们需要至少 2 个以前的数据点来聚合。我们这里的总和就是总和。
【讨论】: