【发布时间】:2019-08-03 07:34:03
【问题描述】:
我在预处理数据时遇到问题。我的数据看起来像
我想按一个表示名为 Account Number 的用户的字段进行分组,并且我想创建一个新字段,它是每个 Account Number 的 Customer Event Type 的所有值的串联。
我试过了:
df_by_accnum = df.groupby('Account Number')[['Customer Event Type']].agg(','.join).reset_index()
但它会导致连接所有列名而不是 hte 值 (https://i.imgur.com/VR5JjC3.png)
我能帮我解决这个问题吗?谢谢
【问题讨论】:
-
我刚试过这个,它不起作用,我得到:KeyError: "Columns not found: 'Customer', 'Event', 'Type'"
-
我的错,我以为你有三个字段!底线是您需要提供minimal reproducible example。您至少可以包含
df的内容示例吗? -
我有31个变量,其中关心的只有2个:账号和客户事件类型,都是字符串。
标签: python pandas dataframe group-by preprocessor