【发布时间】:2021-09-10 15:15:10
【问题描述】:
我是 Pandas 的初学者,真的不知道如何解决这个问题:
我有一个 df,例如像这样:
A B C
process a xawdw 0
process a wdqwdqf 0
process a wqwrq 0
process b rwqrqw 2
process b rwrwr 1
process c qrqrw 1
process c qrrwr 2
process c rt544z 3
process d zrz4z4z 0
process e zrzrz45z4 0
process e 7zkzuk 0
A 列和 B 列对我很重要。有些进程由 3、2 或 1 个 process_instances 组成。对我来说,只有由 3 或 2 组成的那些是重要的(例如 a、b、c、e),并且每个实例的 C 列中的所有值都是 0。
目标:我需要知道有多少进程的值为 0(C 列)。但请记住,一个进程可能包含 3 或 2 个 process_instances。在这种情况下,只有过程 a 和 e 对我很重要,目标是给我这样的东西:
Instances. Total number of only 0-processes
3 instances: 1 (#process a)
2 instances: 1 (#process e)
我尝试了value_counts - 但是它只会返回列 C 中 0 的总数。但我需要在进程的所有实例中列 c 中的值为零的进程总数。
【问题讨论】:
标签: python pandas dataframe data-science data-wrangling