【发布时间】:2015-08-06 09:58:12
【问题描述】:
我正在使用 LIBLINEAR 训练一个简单的逻辑回归分类器。只有3个特征,标签是二进制0-1。
示例输入文件:
1 1:355.55660999775586 2:-3.401379785 3:5
1 1:252.43759050148728 2:-3.96044759307 3:9
1 1:294.15085871437088 2:-13.1649273486 3:14
1 1:432.10492221032933 2:-2.72636786196 3:9
0 1:753.80863694081768 2:-12.4841741178 3:14
1 1:376.54927850355756 2:-6.9494008935 3:7
现在,如果我使用“-s 6”,也就是“L1-regularized logistic regression”,那么10倍交叉验证准确率在70%左右,每次迭代都在几秒钟内完成. 但是如果我用“-s 7”,也就是“L2-regularized logistic regression(dual)”,那么训练迭代次数超过1000,10倍准确率只有60%。
有没有人见过这种奇怪的行为?据我了解,L1 和 L2 之间的唯一区别是正则化项是使用 abs(x) 还是 pow(x, 2)。
【问题讨论】:
标签: machine-learning regression liblinear