【发布时间】:2014-12-28 02:53:36
【问题描述】:
我在 pandas 中有一个这样的 DataFrame:
a b c
A 1 2 3
B 4 5 6
C 7 8 9
我想提取单元格值大于 6 的索引名和列名对。
也就是说,我想获得
[["B","c"], ["C","a"], ["C","b"], ["C","c"]]
有什么聪明的方法可以做到这一点吗?
【问题讨论】:
标签: python pandas dataframe indexing
我在 pandas 中有一个这样的 DataFrame:
a b c
A 1 2 3
B 4 5 6
C 7 8 9
我想提取单元格值大于 6 的索引名和列名对。
也就是说,我想获得
[["B","c"], ["C","a"], ["C","b"], ["C","c"]]
有什么聪明的方法可以做到这一点吗?
【问题讨论】:
标签: python pandas dataframe indexing
您可以使用stack 将框架展平为一系列,使用布尔索引选择您想要的术语,最后将生成的索引变成一个列表:
s = df.stack()
ii = s[s >= 6].index.tolist()
例如:
>>> s = df.stack()
>>> s
A a 1
b 2
c 3
B a 4
b 5
c 6
C a 7
b 8
c 9
dtype: int64
>>> s[s >= 6]
B c 6
C a 7
b 8
c 9
dtype: int64
>>> s[s >= 6].index
MultiIndex(levels=[[u'A', u'B', u'C'], [u'a', u'b', u'c']],
labels=[[1, 2, 2, 2], [2, 0, 1, 2]])
>>> s[s >= 6].index.tolist()
[('B', 'c'), ('C', 'a'), ('C', 'b'), ('C', 'c')]
请注意 (1) 我使用 >= 6 因为这与您的示例相匹配,并且 (2) 这严格来说是一个元组列表,而不是您要求的列表列表,但如果您真的想要,您可以转换到。
【讨论】:
您可以采用 NumPy 路线并使用 np.choose 和 np.argwhere。
创建一个包含行标签和列标签的数组,并使用np.argwhere 返回给定条件成立的整数索引。使用np.choose获取对应的行列索引标签:
>>> xy = np.column_stack((df.index, df.columns))
>>> np.choose(np.argwhere(df >= 6), xy)
array([['B', 'c'],
['C', 'a'],
['C', 'b'],
['C', 'c']], dtype=object)
这将返回一个数组:您可以使用tolist() 来获取 Python 列表:
>>> np.choose(np.argwhere(df >= 6), xy).tolist()
[['B', 'c'], ['C', 'a'], ['C', 'b'], ['C', 'c']]
【讨论】: