【问题标题】:How to pivot pandas DataFrame column to create binary "value table"?如何旋转 pandas DataFrame 列以创建二进制“值表”?
【发布时间】:2017-02-10 06:10:10
【问题描述】:

我有以下熊猫数据框:

import pandas as pd
df = pd.read_csv("filename.csv")

df 
     A   B         C         D        E    
0    a  0.469112 -0.282863 -1.509059  cat  
1    c -1.135632  1.212112 -0.173215  dog   
2    e  0.119209 -1.044236 -0.861849  dog   
3    f -2.104569 -0.494929  1.071804  bird   
4    g -2.224569 -0.724929  2.234213  elephant
...

我想根据column E 中的分类值的标识创建更多列,以便数据框如下所示:

 df 
         A   B         C         D        cat    dog     bird    elephant ....    
    0    a  0.469112 -0.282863 -1.509059  -1      0       0       0
    1    c -1.135632  1.212112 -0.173215   0     -1       0       0
    2    e  0.119209 -1.044236 -0.861849   0     -1       0       0
    3    f -2.104569 -0.494929  1.071804   0      0      -1       0
    4    g -2.224569 -0.724929  2.234213   0      0       0       0
    ...

也就是说,我将E 列的值转换为基于E 值的二进制矩阵,如果值存在则给出1,如果值不存在则给出0 (在这里,我希望它是-1 或“负二进制矩阵”)?

我不确定 pandas 中的哪个函数最能做到这一点:也许是 pandas.DataFrame.unstack()

任何见解都值得赞赏!

【问题讨论】:

    标签: python pandas dataframe binary categorical-data


    【解决方案1】:

    使用pd.concatdropget_dummies

    pd.concat([df.drop('E', 1), pd.get_dummies(df.E).mul(-1)], axis=1)
    

    【讨论】:

    • 非常快速实用!
    猜你喜欢
    • 2016-07-29
    • 1970-01-01
    • 2017-09-08
    • 1970-01-01
    • 2019-08-31
    • 2018-03-24
    • 2021-07-17
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多