【发布时间】:2014-04-10 07:06:57
【问题描述】:
我正在使用 Weka 的 NaiveBayes 分类器。我听说过一些事情,但我不确定它是否属实。有人告诉我,当我在 weka 中有数值时,值越高权重越大。对吗?
我的意思是,如果第一个实例的 feature1(数字)的值为 1,而第二个实例的该特征的值为 2,这是否意味着第二个实例必须对该特征具有更高的权重?
如果是这样,如果我想改变它应该怎么做?
例如,我定义了一个距离特征。但是,越接近越好,这意味着该特征的较低值必须具有较高的权重。
我应该如何在 Weka 中实现它?
【问题讨论】:
-
“重量”是什么意思?它在分类器方面意味着特定的东西,但它不能是你在这里的意思。
-
@SeanOwen ,当我有分类值时,Weka 向我展示了这样的内容: cat 1:频率 20,重量:20 cat 2:频率 30,重量:30 我认为这意味着 a类别与其频率相同。我的理解对吗?现在,我想知道这些权重如何与数字特征一起使用。 Weka 如何衡量一个特征的数值。有没有类似于它对分类特征所做的事情?特征的值 2 的权重是否大于值 1?
标签: machine-learning classification weka language-features