【问题标题】:Need to transpose a pandas dataframe需要转置一个熊猫数据框
【发布时间】:2017-02-11 18:33:22
【问题描述】:

我有一个看起来像这样的系列:

      col1          id
 0      a           10
 1      b           20
 2      c           30
 3      b           10
 4      d           10
 5      a           30
 6      e           40

我想要的输出是这样的:

    a   b   c   d   e
10  1   1   0   1   0
20  0   1   0   0   0
30  1   0   1   0   0
40  0   0   0   0   1

我得到了这个代码:

import pandas as pd

df['dummies'] = 1
df_ind.pivot(index='id', columns='col1', values='dummies') 

我得到一个错误:

    137 
    138         if mask.sum() < len(self.index):
--> 139             raise ValueError('Index contains duplicate entries, '
    140                              'cannot reshape')
    141 

ValueError: Index contains duplicate entries, cannot reshape

存在重复的 id,因为 col1 中的多个值可以归因于一个 id。

我怎样才能达到预期的输出?

谢谢!

【问题讨论】:

    标签: python pandas pivot transpose


    【解决方案1】:

    你可以使用pd.crosstab

    In [329]: pd.crosstab(df.id, df.col1)
    Out[329]:
    col1  a  b  c  d  e
    id
    10    1  1  0  1  0
    20    0  1  0  0  0
    30    1  0  1  0  0
    40    0  0  0  0  1
    

    或者,使用pd.pivot_table

    In [336]: df.pivot_table(index='id', columns='col1', aggfunc=len, fill_value=0)
    Out[336]:
    col1  a  b  c  d  e
    id
    10    1  1  0  1  0
    20    0  1  0  0  0
    30    1  0  1  0  0
    40    0  0  0  0  1
    

    或者,使用groupbyunstack

    In [339]: df.groupby(['id', 'col1']).size().unstack(fill_value=0)
    Out[339]:
    col1  a  b  c  d  e
    id
    10    1  1  0  1  0
    20    0  1  0  0  0
    30    1  0  1  0  0
    40    0  0  0  0  1
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-12-16
      • 2018-05-11
      • 2020-03-07
      • 2020-12-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多