【发布时间】:2017-10-26 14:29:56
【问题描述】:
所以,我有一个高级支点问题。考虑以下数据框
dfa = pandas.DataFrame([["g1","15","Annie","Bard"], ["g2","18","Lux","Annie"], ["g3","15","Olaf","Twitch"]], columns=["gameId", "duration", "Champ1", "Champ2"])
这给出了输出:
通过应用以下堆栈溢出问题 how to pivot complex dataframe 中的逻辑,我得到
pandas.melt(dfa, id_vars=['gameId']) \
.set_index('gameId')['value'] \
.str.get_dummies() \
.groupby(level=0) \
.agg(np.sum)
但是,我不想旋转持续时间列,因此我更改了代码并添加了“value_vars”
pandas.melt(dfa, id_vars=['gameId'], value_vars = ['Champ1','Champ2']) \
.set_index('gameId')['value'] \
.str.get_dummies() \
.groupby(level=0) \
.agg(np.sum)
现在我丢失了持续时间列。此列不是索引,因为它不是唯一的,但我不想旋转它。我已经尝试了将它添加到 'id_vars' 或 'set_index()' 的所有组合,但它似乎不起作用。
想法?
提前致谢!
【问题讨论】:
标签: pandas dataframe pivot melt