【问题标题】:What is Weka's InfoGainAttributeEval formula for evaluating Entropy with continuous values?什么是 Weka 的 InfoGainAttributeEval 公式,用于评估具有连续值的熵?
【发布时间】:2016-06-10 11:19:46
【问题描述】:

我正在使用 Weka 的信息增益属性选择功能,并试图弄清楚 Weka 在处理连续数据时使用的特定公式。

我了解熵的常用公式是this,当数据中的值是离散的时。我知道在处理连续数据时,可以使用微分熵或离散化值。我尝试查看 Weka 对 InfoGainAttributeEval 的解释,并查看了许多其他参考资料,但找不到任何东西。

也许只有我一个人,但有人知道 Weka 是如何实现这个案例的吗?

谢谢!

【问题讨论】:

    标签: machine-learning formula weka entropy information-gain


    【解决方案1】:

    我问过作者 Mark Hall,他说:

    它使用 Fayad 的有监督的基于 MDL 的离散化方法和 伊拉尼。请参阅 javadocs:
    http://weka.sourceforge.net/doc.stable-3-8/weka/attributeSelection/InfoGainAttributeEval.html

    您还可以查看离散化方法的链接:

    http://weka.sourceforge.net/doc.stable-3-8/weka/filters/supervised/attribute/Discretize.html

    【讨论】:

    • 这可能有点晚了,但非常感谢您提供的信息和努力!没有看到 Discretize 函数。
    猜你喜欢
    • 2012-06-08
    • 1970-01-01
    • 2015-03-10
    • 2014-02-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-02-03
    • 2014-12-12
    相关资源
    最近更新 更多