【问题标题】:Predictive Analysis using Java [closed]使用 Java 进行预测分析 [关闭]
【发布时间】:2014-05-19 07:56:11
【问题描述】:

我正在开发一个基于 Spring 的 Web 应用程序,该应用程序根据用户历史数据执行预测分析并向用户提供报价。我需要实现预测分析或任何回归类型的功能,以提供置信度分数/预测来呈现这些报价。我是一名 Java 开发人员,并查看了 Weka、Mahout 以获得所需的结果。但是这两种工具都没有提供好的文档,并且很难继续使用它们。我需要有关基于 Java 的分析 API 的建议,以使用回归或神经网络或决策树处理我的数据,并提供一个置信度分数来描述客户未来购买产品的可能性。

在这方面的任何帮助都非常值得赞赏。

【问题讨论】:

    标签: r weka mahout rjava jri


    【解决方案1】:

    我刚刚完成了一个长期项目,该项目涉及使用 JRI 包使用 JavaFx 和 R 构建 GUI,它使用 R 中 forecast 包中的预测。

    如果你选择这个解决方案 (JavaFX + R) ,所有 R 的统计打包都将被使用,R 有很好的文档,但是接口 jri 是一个挑战。 我构建的程序是独立模式,而不是网络启动。

    大部分都是关于设置所有环境变量,以及将参数传递给JVM,最大的问题是部署,你需要确保你的客户端有R,并在他们的客户端中设置R和Java之间的所有链接个人电脑。

    如果您对使用 Java /JRI 在 R 中进行任何预测分析(树、回归..)感兴趣,请告诉我并发布。

    【讨论】:

    • 非常感谢 Yehoshahat。是的,我非常喜欢使用 R 进行预测分析。事实上,当我开始这个项目时,R 是我最初的选择,但是我找不到任何关于从 Java 调用 R 所涉及的性能开销的可靠信息,因此我正在寻找基于 Java 的 API。如果您向我提供有关预测分析的信息,那可能对我很有帮助。
    • 我有点迷茫,在你开始学习JRI之前,你熟悉R语法吗?
    • 我不熟悉 R 语法,但由于我没有找到任何其他替代方案,我想我应该使用 R
    • 不错的选择,那么在这种情况下,在你开始JRI之前,你知道如何使用R很重要,R的问题是它有点难以开始,看看这个进一步建议:stackoverflow.com/questions/4556524/whats-the-way-to-learn-r
    • 我希望这是您寻找的答案
    【解决方案2】:

    我建议您继续尝试使用 Weka。这是一个很棒的工具,不仅可以用于实施,还可以让您了解哪些算法适合您,您的数据是什么样的等等。 这本书物有所值,但如果您不愿意购买,this wiki page 可能是一个不错的起点。

    最好从测试开始,而不是编程 - 我相信这句话是“机器学习的 60% 的困难在于理解数据集”。玩转 Weka GUI,找出最适合您和您的数据的方法,并尝试一些元分类器(增强、装袋、堆叠);它们通常会产生很好的结果(以处理时间为代价)。

    【讨论】:

    • 感谢 EagleV_Attnam,我还有一个担心是我听说 Weka 不适合大型数据集。我的应用程序的数据集中可能有几百万个项目。您知道它会对性能产生多大影响吗?
    • 我不知道,抱歉。我只将它用于较小的集合。
    • 当你说“巨大的数据集”时,究竟大小是多少?
    猜你喜欢
    • 2013-12-14
    • 2021-04-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-10-10
    • 1970-01-01
    • 2017-11-24
    • 2016-07-04
    相关资源
    最近更新 更多