【问题标题】:python pandas resample count and sumpython pandas重采样计数和总和
【发布时间】:2023-03-13 20:50:02
【问题描述】:

我有按日期计算的数据,并希望按周创建一个新的数据框,其中包含销售额总和和类别计数。

#standard packages
import numpy as np
import pandas as pd

#visualization
%matplotlib inline
import matplotlib.pylab as plt

#create weekly datetime index
edf = pd.read_csv('C:\Users\j~\raw.csv', parse_dates=[6])
edf2 = edf[['DATESENT','Sales','Category']].copy()
edf2

#output

DATESENT    |  SALES  | CATEGORY
2014-01-04      100        A
2014-01-05      150        B
2014-01-07      150        C
2014-01-10      175        D

#create datetime index of week
edf2['DATESENT']=pd.to_datetime(edf2['DATESENT'],format='%m/%d/%Y')
edf2 = edf2.set_index(pd.DatetimeIndex(edf2['DATESENT']))
edf2.resample('w').sum()
edf2

#output

            SALES CATEGORY 
DATESENT     
2014-01-05  250      AB
2014-01-12  325      CD

但我正在寻找

           SALES CATEGORY 
DATESENT     
2014-01-05  250      2
2014-01-12  325      2

这没用...

edf2 = e2.resample('W').agg("Category":len,"Sales":np.sum)

谢谢

【问题讨论】:

    标签: python pandas datetime indexing


    【解决方案1】:

    Agg 将字典作为 various formats 中的参数。

    edf2 = e2.resample('W').agg({"Category":'size',"Sales":'sum'})
    

    【讨论】:

    • 也是一个很好的答案+1
    • 谢谢,我正在向您学习 piRSquared。我确实更喜欢 TimeGrouper,而不是一般的重新采样。
    • 非常感谢,有没有办法做大小但又不同?那么如果有两次A类,就算一次呢?
    • 是的,您可以更改“nunique”的尺寸。看看这是否适合你。
    • 谢谢!两个答案都很好,试图弄清楚我是否可以同时接受
    【解决方案2】:

    使用pd.TimeGrouper + agg

    f = {'SALES': 'sum', 'CATEGORY': 'count'}
    g = pd.TimeGrouper('W')
    df.set_index('DATESENT').groupby(g).agg(f)
    
                CATEGORY  SALES
    DATESENT                   
    2014-01-05         2    250
    2014-01-12         2    325
    

    【讨论】:

    • TimeGrouper 与重采样相比有什么优势?我需要将此数据用于时间序列预测,我可以将它与 TImegrouper 一起使用吗?有没有办法对类别进行不同的计数?谢谢
    • @jeangelj 使用 TimeGrouper 没有真正明显的优势。是的!要获取唯一值的数量,请将 'count' 替换为 'nunique'
    • 谢谢!两个答案都很好,试图弄清楚我是否可以同时接受
    • @jeangelj 不,你不能。您可以对两者都投赞成票!...选择您认为最有帮助的答案,如果您仍然无法决定,请接受 ScottBoston 的答案
    • 谢谢@piRSquared,你每隔一天就帮我一次,所以我一定会很快给你加分(我保证)——我都赞成——非常感谢你的帮助,这是无价的
    猜你喜欢
    • 2019-06-14
    • 1970-01-01
    • 2014-02-24
    • 2017-05-20
    • 2021-06-14
    • 2018-02-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-04
    相关资源
    最近更新 更多