【发布时间】:2020-03-07 17:02:59
【问题描述】:
我有 Information Gain 数据框和 tf 数据框。数据如下所示:
信息增益
Term IG
0 alqur 0.641328
1 an 0.641328
2 ayatayat 0.641328
3 bagai 0.641328
4 bantai 0.641328
5 besar 0.641328
词频
A B A+B
ahli 1 0 1
alas 1 0 1
alqur 0 1 1
an 0 1 1
ayatayat 0 1 1
... ... ... ...
terus 0 1 1
tuduh 0 1 1
tulis 1 0 1
ulama 1 0 1
upaya 0 1 1
假设表格信息增益 = IG 和表 tf = TF
如果“术语”包含在 TF“术语”中并且它的类 (A/B) 值为 1,我想从 IG 计算“术语”。它类似于 excel 中的COUNTIF(range_term, term),但我不知道如何使用 pandas 或 numpy 或其他任何东西来做到这一点。
【问题讨论】:
-
不确定 python 语法,但 R 会使用 filter()
标签: python pandas numpy classification text-classification