【发布时间】:2022-01-07 16:30:39
【问题描述】:
我很难对数据进行排序。在我试图弄清楚这一点的时间里,我可以手动创建一个新的 .csv 文件,但我需要通过代码来做到这一点。我有一个 150 年前球员棒球薪水的大型数据集。 This is what my dataset looks like.
我想创建一个新的数据框,用于添加给定球队在给定年份的个人球员工资,按球队和年份组织。使用以下技术,我想出了这个:team_salaries_groupby_team = salaries.groupby(['teamID','yearID']).agg({'salary' : ['sum']}),它输出这个:my output。在屏幕上它看起来有点像我想要的,但我想要一个包含三列的数据框(加上左侧的索引)。我真的不能对这个输出做我想做的那种分析。
最后,我也试过这个方法:new_column = salaries['teamID'] + salaries['yearID'].astype(str) salaries['teamyear'] = new_column salaries teamyear = salaries.groupby(['teamyear']).agg({'salary' : ['sum']}) print(teamyear)。 Another output 它添加了给定年份每支球队的个人球员工资,但现在我不知道如何将年份分开并将其放入自己的列中。请帮忙?
【问题讨论】:
标签: python pandas dataframe sorting pandas-groupby