【问题标题】:Pandas Group By Multiple Colums and Calculate Standard DeviationPandas 按多列分组并计算标准偏差
【发布时间】:2019-10-31 10:14:23
【问题描述】:

我有一个 pandas 数据框,其中包含来自多个赛季和多个球队的 NBA 篮球运动员的统计数据。它看起来像这样:

Year         Team          Player            PTS/G 
2018         Lakers        Lebron James      27.6
2018         Lakers        Kyle Kuzma        10.3
2019         Rockets       James Harden      25.5
2019         Rockets       Russel Westbrook  23.2

我想创建一个名为“PTS Dev”的新列,它是每个团队和年份的 PTS/G 标准差。然后,我计划根据该偏差分析玩家的位置。这是我计算该列的尝试:

final_data['PTS Dev'] = final_data.groupby('Team', 'Year')['PTS/G'].std()

【问题讨论】:

    标签: pandas-groupby standard-deviation


    【解决方案1】:

    groupbytransform 一起使用

    final_data['PTS Dev'] = final_data.groupby(['Team', 'Year'])['PTS/G'].transform('std')
    final_data
    Out[9]: 
       Year     Team            Player  PTS/G    PTS Dev
    0  2018   Lakers      Lebron James   27.6  12.232947
    1  2018   Lakers        Kyle Kuzma   10.3  12.232947
    2  2019  Rockets      James Harden   25.5   1.626346
    3  2019  Rockets  Russel Westbrook   23.2   1.626346
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-04-24
      • 2021-06-14
      • 2020-11-08
      • 2015-11-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多