【发布时间】:2022-08-23 17:36:23
【问题描述】:
我有一个 Pandas DataFrame,其中一列中有一些分类数据。在该特定列上执行 value_counts 时,我得到类似于:
HR 176
Coding 81
Reject 74
Database Administration 21
Finance 17
Project Management 16
Sales 15
DevOps 13
Core Electronics 10
Networking 10
Medical Science 9
Core Mechanical 8
Web Development 4
Puzzles 3
behavioural 3
not a question 2
civil engineering 1
Mathematics 1
Finance, Medical Science 1
Sales, HR 1
我想做的是只保留计数 >= 某个阈值(例如 10)的类别。所有较小的类别都应归入一个单独的“其他”类别,即结果应如下所示:
HR 176
Coding 81
Reject 74
*Other* 33
Database Administration 21
Finance 17
Project Management 16
Sales 15
DevOps 13
Core Electronics 10
Networking 10
我过去通过将defaultdict(int) 组合在一起并仅采用计数> = 阈值的实例来完成此操作。我想知道是否有熊猫规范的方式来实现相同的目标。