【问题标题】:fill multi index groupby pandas填充多索引 groupby pandas
【发布时间】:2018-04-17 12:39:33
【问题描述】:

好的,所以我有这个庞大的数据集数百万行,我在使用 loc == 和 isin 过滤数据时遇到了麻烦,我怀疑它的大小,所以我有一个想法,我想我会做一个多索引 pivot_table然后过滤较小的数据透视表。但很明显,当我进行旋转时,我会得到这样的结果:

    foo 2011 354
        2013 659
        2014 655
    bar 2012 645
        2013 665

我可以过滤这个,除非我在 foo 和 bar 下有空格?如果这些是 nans,我可以填充 nans,但这些是空格,我确定我以前见过这个,但我不记得该怎么做,如何填充 foo 和 bar 下的空格?将其制成完整的数据框后,我可以对其进行过滤吗?

编辑我不确定为什么我的原始代码不会运行,看起来很简单?

    df2 = df1.loc[Mort_Data['COD_type'].isin(['T','U','V','W','Y','X'])]

【问题讨论】:

  • 你试过df.loc['foo']df.loc[('foo',2011)]
  • 我认为只是没有显示,一切正常。
  • 抱歉,您的意思是在我透视数据之前还是之后?我在旋转数据之前尝试了 df.loc[df['Year'].isin(['2014'])] 但它无法运行我认为数据太大

标签: pandas pivot-table spaces multi-index


【解决方案1】:

foo 下的所有空格实际上都是 foo 和 bar 相同。它只是多索引时易于可视化的功能。如果你使用 reset_index() 如果我怀疑是真的,你会看到它们。

至于你的其他问题。数百万行并不是那么大,但是如果您真的因为数据的大小而遇到问题,那么您可以分批进行。有很多选择。

【讨论】:

    猜你喜欢
    • 2016-11-30
    • 2018-07-27
    • 2022-07-19
    • 1970-01-01
    • 1970-01-01
    • 2021-07-13
    • 1970-01-01
    • 2020-03-26
    • 2019-11-18
    相关资源
    最近更新 更多