【发布时间】:2020-06-16 12:22:25
【问题描述】:
我有一个像这样的 ndarray
LABEL1 99 113 2010-04-26 20:12:23+00:00
LABEL1 29 143 2010-05-06 20:12:23+00:00
LABEL1 99 323 2010-02-12 20:12:23+00:00
LABEL1 23 223 2010-04-25 20:12:23+00:00
LABEL2 23 23 2010-01-21 20:12:23+00:00
LABEL1 234 123 2010-12-26 20:12:23+00:00
LABEL1 93 133 2010-02-23 20:12:23+00:00
LABEL4 19 1223 2010-07-24 20:12:23+00:00
我需要做一些聚合并返回为 dict..
我最后应该得到的类似于这个
[
{ 'LABEL1': { 'COLA':577, 'COLB': 1058, 'LAST': '2010-12-26 20:12:23+00:00' } },
{ 'LABEL2': { 'COLA':23, 'COLB': 23, 'LAST': '2010-01-21 20:12:23+00:00' } },
{ 'LABEL4': { 'COLA':19, 'COLB':1223, 'LAST': '2010-07-24 20:12:23+00:00' } }
]
我想的办法是转换成DataFrame,然后做一个group().agg...
aggr = select_df.groupby('LABELS').agg({'LABELS': [('LABELS', 'max')], 'COLA': [('COLA', 'sum'), ('COLB', 'count')], {'LAST': [('LAST', 'max')]})
我对 Python 有点陌生...并且对执行此操作所需的所有数据转换做噩梦...
原来的结构是一个列表
[
{ 'Label': 'xxxx', 'LABELS': 'xxxx', 'COLA': ##, 'COLB': ##, 'LAST': 'datetime' },...
]
如果我可以简单地直接聚合这个列表,然后与下一个通道连接(列表以块的形式读取)以获得如上所述的最终列表......
【问题讨论】:
-
你能分享
print(your_array)的输出吗? 原来的结构是一个列表 你要把列表转换成一个ndarray,是吗?请提供正确的minimal reproducible example。
标签: python pandas list dataframe arraylist