【发布时间】:2021-06-01 07:41:44
【问题描述】:
我想创建一个过滤数据框列中特定值的函数(
我的数据框具有以下列和值:
| Zoekterm | High_bias |
|---|---|
| Man | 1 |
| Man | 1 |
| Vrouw | 1 |
| kind | 0 |
我写了一个过滤特定值的函数,见下文
Def most_likey_bias():
bias = data['high_bias'] == 1
if bias.any():
print(data.loc[bias,['High_bias','Zoekterm']
print(most_likey_bias())
表格的结果是:
| Zoekterm | High_bias |
|---|---|
| vrouw | 1 |
| kind | 1 |
该表给出了哪个“Zoekterm”的值为 1
但是因为“Zoekterm”有同名的重复项,所以我想要一个表格来计算每个 zoekterm
所以我想要的表是:
这意味着一个表格,它根据特定值 (1) 计算每个“Zoekterm”有多少“高偏差”
| Zoekterm | High_bias |
|---|---|
| Man | 4 |
| Vrouw | 2 |
| kind | 5 |
我尝试了 groupby 或 count,但我不明白。谁能给我一些建议。
【问题讨论】:
标签: python pandas dataframe data-science