【问题标题】:How to only keep rows in a Pandas DataFrame based on its count in a given column如何根据给定列中的计数仅保留 Pandas DataFrame 中的行
【发布时间】:2022-08-23 17:36:23
【问题描述】:

我有一个 Pandas DataFrame,其中一列中有一些分类数据。在该特定列上执行 value_counts 时,我得到类似于:

HR                          176
Coding                       81
Reject                       74
Database Administration      21
Finance                      17
Project Management           16
Sales                        15
DevOps                       13
Core Electronics             10
Networking                   10
Medical Science               9
Core Mechanical               8
Web Development               4
Puzzles                       3
behavioural                   3
not a question                2
civil engineering             1
Mathematics                   1
Finance, Medical Science      1
Sales, HR                     1

我想做的是只保留计数 >= 某个阈值(例如 10)的类别。所有较小的类别都应归入一个单独的“其他”类别,即结果应如下所示:

HR                          176
Coding                       81
Reject                       74

*Other*                      33

Database Administration      21
Finance                      17
Project Management           16
Sales                        15
DevOps                       13
Core Electronics             10
Networking                   10

我过去通过将defaultdict(int) 组合在一起并仅采用计数> = 阈值的实例来完成此操作。我想知道是否有熊猫规范的方式来实现相同的目标。

    标签: python pandas dataframe


    【解决方案1】:

    这是您正在寻找的答案吗:

    Pandas: Selecting rows based on value counts of a particular column

    希望能帮助到你 !

    【讨论】:

      猜你喜欢
      • 2020-12-06
      • 2020-02-17
      • 1970-01-01
      • 2022-11-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-07-28
      • 2013-08-12
      相关资源
      最近更新 更多