【发布时间】:2013-05-21 11:31:20
【问题描述】:
我想对SVC 分类器的概率输出运行网格搜索交叉验证。特别是我想最小化负对数可能性。从文档来看,GridSearchCV 似乎调用了它所传递的估计器的predict() 方法,而SVC 的predict() 方法返回类预测而不是概率(predict_proba() 返回类概率)。
1) 我是否需要继承 SVC 并给它一个 predict() 方法来返回概率而不是类来完成我的对数似然交叉验证?我想我需要自己写score_func 或loss_func?
2) 对这种负对数似然性进行交叉验证是愚蠢的吗?我正在这样做 b/c 数据集是:a)不平衡 5:1 和 b)根本不可分离,即即使是“最差”的观察结果也有 > 50% 的机会进入“好”类。 (可能还会在统计问答中发布第二个问题)
【问题讨论】:
标签: python machine-learning scikit-learn