【问题标题】:Extract indices of cells meeting criteria from pandas DataFrame从 pandas DataFrame 中提取符合标准的单元格索引
【发布时间】:2014-12-28 02:53:36
【问题描述】:

我在 pandas 中有一个这样的 DataFrame:

  a b c
A 1 2 3 
B 4 5 6
C 7 8 9

我想提取单元格值大于 6 的索引名和列名对。

也就是说,我想获得

[["B","c"], ["C","a"], ["C","b"], ["C","c"]]

有什么聪明的方法可以做到这一点吗?

【问题讨论】:

    标签: python pandas dataframe indexing


    【解决方案1】:

    您可以使用stack 将框架展平为一系列,使用布尔索引选择您想要的术语,最后将生成的索引变成一个列表:

    s = df.stack()
    ii = s[s >= 6].index.tolist()
    

    例如:

    >>> s = df.stack()
    >>> s
    A  a    1
       b    2
       c    3
    B  a    4
       b    5
       c    6
    C  a    7
       b    8
       c    9
    dtype: int64
    >>> s[s >= 6]
    B  c    6
    C  a    7
       b    8
       c    9
    dtype: int64
    >>> s[s >= 6].index
    MultiIndex(levels=[[u'A', u'B', u'C'], [u'a', u'b', u'c']],
               labels=[[1, 2, 2, 2], [2, 0, 1, 2]])
    >>> s[s >= 6].index.tolist()
    [('B', 'c'), ('C', 'a'), ('C', 'b'), ('C', 'c')]
    

    请注意 (1) 我使用 >= 6 因为这与您的示例相匹配,并且 (2) 这严格来说是一个元组列表,而不是您要求的列表列表,但如果您真的想要,您可以转换到。

    【讨论】:

      【解决方案2】:

      您可以采用 NumPy 路线并使用 np.choosenp.argwhere

      创建一个包含行标签和列标签的数组,并使用np.argwhere 返回给定条件成立的整数索引。使用np.choose获取对应的行列索引标签:

      >>> xy = np.column_stack((df.index, df.columns))
      >>> np.choose(np.argwhere(df >= 6), xy)
      array([['B', 'c'],
             ['C', 'a'],
             ['C', 'b'],
             ['C', 'c']], dtype=object)
      

      这将返回一个数组:您可以使用tolist() 来获取 Python 列表:

      >>> np.choose(np.argwhere(df >= 6), xy).tolist()
      [['B', 'c'], ['C', 'a'], ['C', 'b'], ['C', 'c']]
      

      【讨论】:

        猜你喜欢
        • 2016-12-17
        • 2016-11-30
        • 1970-01-01
        • 2019-02-01
        • 1970-01-01
        • 2012-11-30
        • 1970-01-01
        • 2020-02-13
        • 2020-01-28
        相关资源
        最近更新 更多