【发布时间】:2020-08-17 19:20:42
【问题描述】:
我正在尝试分析一个 DataFrame,其中包含 Date 作为索引,Name 和 Message 作为列。
df.head() 返回:
Name Message
Date
2020-01-01 Tom image omitted
2020-01-01 Michael image omitted
2020-01-02 James image Happy new year you wonderfully awfully people...
2020-01-02 James I was waiting for you image
2020-01-02 James QB whisperer image
这是我试图取消初始 df 的数据透视表,其中 aggfunc 是单词存在的计数(例如图像)
df_s = df.pivot_table(values='Message',index='Date',columns='Name',aggfunc=(lambda x: x.value_counts()['image']))
理想情况下,作为示例:
Name Tom Michael James
Date
2020-01-01 1 1 0
2020-01-02 0 0 3
例如,我使用了另一个 df.pivot_table
df_m = df.pivot_table(values='Message',index='Date',columns='Name',aggfunc=lambda x: len(x.unique()))
根据一天中的消息数量进行聚合,然后返回表格。
提前致谢
【问题讨论】:
标签: python pandas lambda pivot-table aggregate-functions