【发布时间】:2016-11-22 18:58:19
【问题描述】:
当我使用 scikit learn 时,我得到了两组不同的 p 值
predKbest= SelectKBest(sklearn.feature_selection.f_regression, k=i).fit(X_train, y_train)
predKbest.pvalues_
和
predKbest= SelectKBest(sklearn.feature_selection.chi2, k=i).fit(X_train, y_train)
predKbest.pvalues_
在相同的数据 X_train 和 y_train 上。它们应该是不同的p值吗?
【问题讨论】:
-
Chi2 进行 Chi2 测试,而 f_regression 是 fischer 测试。它们注定是不同的。
-
@MohamedALANI 我知道。我的问题是,如果在同一个函数 SelectKBest 中计算这两个选项的 pvalues 不同?
-
我明白了,我没有很好地阅读您的问题,对此感到抱歉。我相信它们的计算方式相同。在您选择两个不同的特征后,您的变量数量是否相同?
-
@MohamedALANI,是的,它们是完全相同的数据。可能他们有不同的假设。但是,到目前为止,与这些功能相关的文档对我来说似乎还不清楚。
标签: scikit-learn feature-selection p-value