【发布时间】:2015-12-10 04:40:38
【问题描述】:
我正在尝试拟合二元分类模型并预测属于这些类的值的概率。
我的第一个问题是我无法解释结果。我有一个训练集,其中labels=0 和labels=1(不是-1 and +1)。
我运行模型:
vw train.vw -f model.vw --link=logistic
下一步:
vw test.vw -t -i model.vw -p pred.txt
然后我有一个文件pred.txt,其中包含这些值:
0.5
0.5111
0.5002
0.5093
0.5
我不明白 0.5 是什么意思? pred.txt 中的所有值约为 0.5。我写了脚本并从结果中扣除了 0.5。我明白了:
0
0.111
0.002
0.093
0
这是我想要的概率吗?
这是我的第二个问题 - 我的目标类不平衡。我有 95% 的阴性 (0) 和 5% 的阳性结果 (1)。我怎么能规定大众制造了阶级的不平衡,比如{class 0:0.1, class 1:0.9}?
还是应该在准备数据集的时候做?
【问题讨论】:
标签: classification vowpalwabbit