【问题标题】:Memory Requirement of Commons Math: The Apache Commons Mathematics LibraryCommons Math 的内存要求:Apache Commons 数学库
【发布时间】:2015-03-22 06:26:41
【问题描述】:

我想知道 Apache Commons Math 中的所有操作是否都在内存操作中。 我对 OLSMultipleLinearRegression 以及将其用于大数据特别感兴趣。

还有任何现有的 JAVA API 用于在大数据上运行回归。

【问题讨论】:

  • Stephen 在下面的回答看起来很有说服力,但如果您想与开发人员进行验证,我建议您也发送电子邮件至 commons user mailing list,并在您的主题前加上 [math]。我敢肯定,您会得到快速回复(您可以在此处发布以供后代使用)。

标签: java apache-commons apache-commons-math


【解决方案1】:

我对@9​​87654322@ 类的javadocs 的解读是它完全在内存中。首先,模型和样本数据必须作为原始数组提供,这排除了任何不适合内存的表示的可能性……至少在您提供输入的那一点。

【讨论】:

  • 感谢斯蒂芬和邓肯的投入。是否有任何 API 允许在不使用内存的情况下对大数据进行回归。
  • 我没找到,但我看的不是很仔细。
【解决方案2】:

OLSMultipleLinearRegression 将完整的设计矩阵存储在内存中是正确的。但是,在同一个 Commons Math 包(3.0 版以后)中还有另一个 OLS 实现类 MillerUpdatingRegression,它不会将输入数据集存储在内存中。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-02-28
    • 2013-02-24
    • 2011-12-21
    • 2011-06-27
    • 1970-01-01
    • 2014-05-01
    • 2014-08-06
    • 2012-04-23
    相关资源
    最近更新 更多