【问题标题】:How to fill in gaps of duplicate indices in dataframe? [duplicate]如何填补数据框中重复索引的空白? [复制]
【发布时间】:2022-02-04 16:12:56
【问题描述】:

我有一个如下所示的数据框

tdf = pd.DataFrame({'grade': np.random.choice(list('AAAD'),size=(5)),
                   'dash': np.random.choice(list('PPPS'),size=(5)),
                   'dumeel': np.random.choice(list('QWRR'),size=(5)),
                   'dumma': np.random.choice((1234),size=(5)),
                   'target': np.random.choice([0,1],size=(5))
})

我正在尝试使用一些输入列创建多索引数据框

所以,我尝试了以下

tdf.set_index(['grade','dumeel'],inplace=True)

但是,这会导致重复条目的缺失/间隙(红色突出显示)

我怎样才能避免这种情况,并用所有索引显示我的数据框(无论它是否重复)

我希望我的输出具有基于原始数据帧的相应索引的所有行

【问题讨论】:

    标签: python pandas dataframe series multi-index


    【解决方案1】:

    只是显示问题:

    tdf.set_index(['grade','dumeel'],inplace=True)
    
    print (tdf)
                 dash  dumma  target
    grade dumeel                    
    A     W         S    855       1
          R         P    498       1
          R         P    378       0
          W         P    211       0
          W         P     12       0
          
    with pd.option_context("display.multi_sparse", False):
        print (tdf)
                 dash  dumma  target
    grade dumeel                    
    A     W         S    855       1
    A     R         P    498       1
    A     R         P    378       0
    A     W         P    211       0
    A     W         P     12       0
    

    【讨论】:

      猜你喜欢
      • 2018-10-28
      • 1970-01-01
      • 2012-10-19
      • 2023-03-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-06-10
      • 2015-04-12
      相关资源
      最近更新 更多