【发布时间】:2023-02-21 15:21:02
【问题描述】:
我有这样的数据框
TxnId TxnDate TxnCount
233 2023-02-01 2
533 2023-02-01 1
433 2023-02-01 4
233 2023-02-02 3
533 2023-02-02 5
233 2023-02-03 3
533 2023-02-03 5
433 2023-02-03 2
我想计算从今天开始最多过去 3 天的每个 TxnId 的 TxnCount 平均值,并将其放在单独的列中。
让我们说今天 = 2023-02-04。在 2023 年 2 月 1 日之前,我需要 TxnId 的平均 TxnCount。我的预期结果将是。
TxnId TxnDate TxnCount AVG
233 2023-02-01 2 2
533 2023-02-01 1 1
433 2023-02-01 4 4
233 2023-02-02 3 2.5 [(3+2)/2]
533 2023-02-02 5 3 [(5+1)/2]
233 2023-02-03 3 2.66 [(3+3+2)/3]
533 2023-02-03 5 3.66 [(5+5+1)/3]
433 2023-02-03 2 3 [(2 + 4)/2] Only for two days TxnId is present
你能帮忙如何在 python 中实现这个吗?
【问题讨论】: