【问题标题】:Java library to generate and work with generated decision trees用于生成和使用生成的决策树的 Java 库
【发布时间】:2012-04-25 01:35:38
【问题描述】:

我正在寻找一个 Java 库,它不仅可以使用 ID3 或 C4.5 算法构建决策树,还可以以某种合适的格式存储新构建的树。问题是我打算使用决策树引擎作为某种用户需求推断系统,即在使用训练数据生成决策树之后,我想给它输入(来自用户的数据)并将输出用作给用户的建议。简单地说,我只是不想能够遍历生成的树并根据输入数据集得到结果。我还想不仅构建二叉决策树,还想为每个父节点构建具有可变数量的子节点的树(这意味着某些节点可能有两个子节点,有些节点可能有三个,这都取决于父节点中检查的属性值)。我刚开始使用决策树,在这个领域没有太多经验。我使用谷歌搜索,开始查看 WEKA,但我不确定它是否满足我的要求。任何指导都会有很大帮助。提前致谢!

【问题讨论】:

    标签: java data-mining weka id3 decision-tree


    【解决方案1】:

    Weka 是最先进的分类工具,包括 C4.5。一定要试一试。

    事实上,许多其他工具(KNIME、Rapidminer)通常只是围绕着 Weka,本质上是做一些数据预处理、用户界面、实验运行等,但主要任务委托给 Weka。

    在我看来,Weka 的设计并不完美,但它是分类和预测方面的参考实现。 所以试一试吧!当您正在研究其他任务(例如集群或异常检测)时,请改用其他工具,例如 ELKI。 Wekas 聚类算法极少。

    【讨论】:

    • 我一定会试一试的。但是您提到,在您的观点中,WEKA 并不是为此而设计的。这种情况下,用什么库比较好?
    • 我不知道周围有没有更好的。似乎每个人都使用 Weka 或 GNU R 进行分类。
    • 还有其他商业软件包可用。统计学就是其中之一。有趣的是,Weka 和 R 都必须在他们的 CART 决策树实现中做出权衡,因为描述 CART 算法的书对算法的一部分保密。它描述了一种难以解决的算法(如及时),然后说他们实现的实际算法不是这个。不是你必须知道的,R 和 Weka 的算法在不知道的情况下表现得足够好。但是,只是一些有趣的琐事。
    【解决方案2】:

    使用 weka,它很受欢迎、性能强大、稳定、有据可查,人们将能够帮助您。

    【讨论】:

      猜你喜欢
      • 2012-06-29
      • 2017-05-14
      • 2019-02-11
      • 2018-03-27
      • 2015-06-17
      • 2010-10-22
      • 2021-04-30
      • 2015-10-08
      • 2013-02-08
      相关资源
      最近更新 更多