【发布时间】:2017-08-05 15:52:10
【问题描述】:
根据文档,可以为SGDClassifier 指定不同的损失函数。据我了解,log loss 是一个 cross-entropy 损失函数,理论上可以处理软标签,即以某些概率 [0,1] 给出的标签。
问题是:是否可以将SGDClassifier 与log loss 一起使用来解决带有软标签的分类问题?如果不是 - 如何使用 scikit-learn 解决这个任务(软标签上的线性分类)?
更新:
target 的标记方式以及问题的性质,硬标签不会产生好的结果。但这仍然是一个分类问题(不是回归),我不想保留对prediction 的概率解释,所以回归也不能开箱即用。交叉熵损失函数可以自然地处理target 中的软标签。 scikit-learn 中线性分类器的所有损失函数似乎都只能处理硬标签。
所以问题大概是:
例如,如何为SGDClassifier 指定我自己的损失函数。似乎scikit-learn 并没有坚持这里的模块化方法,需要在其源代码中的某个地方进行更改
【问题讨论】:
标签: scikit-learn