【发布时间】:2019-04-28 21:34:46
【问题描述】:
我有一个包含间隔的表格
dfa = pd.DataFrame({'Start': [0, 101, 666], 'Stop': [100, 200, 1000]})
我有另一个包含时间戳和值的表
dfb = pd.DataFrame({'Timestamp': [102, 145, 113], 'ValueA': [1, 2, 21],
'ValueB': [1, 2, 21]})
我需要创建一个与dfa 大小相同的数据框,并添加一个包含ValueA/ValueB 聚合结果的列,用于dfb 中包含Timestamp 的所有行在Start 和Stop 之间。
所以在这里如果将我的聚合定义为
{'ValueA':[np.nanmean,np.nanmin],
'ValueB':[np.nanmax]}
我想要的输出是:
ValueA ValueA ValueB
nanmean nanmin nanmax Start Stop
nan nan nan 0 100
8 1 21 101 200
nan nan nan 666 1000
【问题讨论】:
标签: python pandas dataframe aggregation