【发布时间】:2015-09-13 11:55:24
【问题描述】:
我正在使用 NLTK 的 BigramAssocMeasures.chi_sq 来找出不同类别的单词提供的信息内容。但是我无法弄清楚如何向这个函数提供数据。
NLTK 的定义说 """使用卡方对二元组进行评分,即 phi-sq 乘以二元组的数量,如 Manning 和 Schutze 5.3.3 中所示。 """ 返回 n_xx * cls.phi_sq(n_ii, (n_ix, n_xi), n_xx)
n_ii, (n_ix, n_xi), n_xx 代表什么?
【问题讨论】:
标签: python nltk chi-squared