【问题标题】:Grouping and column difference calculating in PandasPandas 中的分组和列差计算
【发布时间】:2018-10-02 20:02:41
【问题描述】:

我想分析时间序列数据中的频率模式,但存在一些技术问题。在 Pandas 中有一个数据框:

Date                  Label
2017-03-22 15:16:45   20
2017-03-22 16:12:00   15
2017-03-22 22:10:23   20
2017-03-23 17:00:03   11
2017-03-24 10:11:13   20
2017-03-25 14:02:54   20

我想计算“Date”列中的值之间的差异,这两个值按标签“20”的标签分组。在我看来,它应该看起来像 timedelta 列的区别和标签列:

DateDiff              Label
0 days 06:53:38       20
1 days 12:00:50       20
1 days 03:51:41       20

如何使用 pandas groupby 选项?

【问题讨论】:

    标签: python pandas datetime dataframe pandas-groupby


    【解决方案1】:

    让我们使用

    df.assign(diff=df.groupby('Label')['Date'].diff()).dropna()
    

    输出:

                     Date  Label            diff
    2 2017-03-22 22:10:23     20 0 days 06:53:38
    4 2017-03-24 10:11:13     20 1 days 12:00:50
    5 2017-03-25 14:02:54     20 1 days 03:51:41
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-06-17
      • 1970-01-01
      • 2023-02-20
      • 2019-09-27
      • 2021-04-03
      • 2022-08-17
      • 2014-05-20
      相关资源
      最近更新 更多