【发布时间】:2018-04-17 12:39:33
【问题描述】:
好的,所以我有这个庞大的数据集数百万行,我在使用 loc == 和 isin 过滤数据时遇到了麻烦,我怀疑它的大小,所以我有一个想法,我想我会做一个多索引 pivot_table然后过滤较小的数据透视表。但很明显,当我进行旋转时,我会得到这样的结果:
foo 2011 354
2013 659
2014 655
bar 2012 645
2013 665
我可以过滤这个,除非我在 foo 和 bar 下有空格?如果这些是 nans,我可以填充 nans,但这些是空格,我确定我以前见过这个,但我不记得该怎么做,如何填充 foo 和 bar 下的空格?将其制成完整的数据框后,我可以对其进行过滤吗?
编辑我不确定为什么我的原始代码不会运行,看起来很简单?
df2 = df1.loc[Mort_Data['COD_type'].isin(['T','U','V','W','Y','X'])]
【问题讨论】:
-
你试过
df.loc['foo']或df.loc[('foo',2011)] -
我认为只是没有显示,一切正常。
-
抱歉,您的意思是在我透视数据之前还是之后?我在旋转数据之前尝试了 df.loc[df['Year'].isin(['2014'])] 但它无法运行我认为数据太大
标签: pandas pivot-table spaces multi-index