【发布时间】:2021-12-01 07:16:55
【问题描述】:
我正在处理一个存储在 pandas 数据框中的大型数据集。我为操作此数据集而编写的所有方法都适用于数据帧,但其中一些不适用于 GroupBy 对象。
在我的代码中,我想按作者姓名对所有数据进行分组(我可以通过 .groupby() 轻松实现)。不幸的是,这会输出一个 GroupBy 对象,当我想使用仅数据框的方法时,它对我来说不是很有用。
我已经搜索了大量其他帖子,但没有找到任何令人满意的答案...如何将此 GroupBy 对象转换回 DataFrame? (注意:手动选择组并将它们连接到数据框中对我来说太大了,我需要一些自动化的东西)。
【问题讨论】:
-
for group_name, group in df.groupby(your_columns_here):这里组将为您提供一个数据框,您可以将其传递给您想要的方法 -
请提供足够的代码,以便其他人更好地理解或重现问题。
-
@MuhammadHassan 我没有意识到该组是该元组输出中的数据框!这实际上使我的最终用例(计算每个组中另一列的 value_counts)更容易完成。谢谢!
标签: python pandas dataframe pandas-groupby